Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
Li Jian
@CatCatBros
在和朋友做一些很酷的事情 making @lobehub @openomy_hub better Bitcoin Lover & Web3 Friendly github:
America
Joined December 2020
724
Following
150
Followers
789
Posts
Li Jian
@CatCatBros
3 days ago
找到了当时找工作时候一些公司面试的记录。 时过境迁,一晃已经是 5 年了
Li Jian
@CatCatBros
19 days ago
@xiangyuli
非常���同 这是为数不多,会因为员工反馈从而调整的例子了,以往员工内网吐槽都是没有后续的,我也并不觉得这是无情无义 难道为了所谓的员工第二就只能是口头吗? 🧐 没有任何反馈的话,对员工来说是否又是有情有义了呢?
Li Jian
@CatCatBros
23 days ago
@MaxForAI
身上看到了傲慢 🧐
Li Jian
@CatCatBros
23 days ago
vibe coding 后,我电脑每隔一周就得重启一次,不然开发的额时候会立刻起飞,有人有类似的问题吗? AI 分析后说是 spotlight 的索引机制问题 说是因为 spotlight 会在某些情况下索引 node_modules 全量扫描 🧐 但为什么 vibe 之前,古法编程就没出现过几次。。。
CatCatBros
retweeted
空谷 Arvin Xu
@arvin17x
24 days ago
这���必须得出来说下,Gemini 3 系列的模型问题并不是不爱做工具调用,而是工程层做的太烂了。 去年 Gemini 3 出来的时候,我们在 MCPMark (评测 Model 使用 MCP 的工具调用能力)跑过它的分,是非常高的,pass@1 有 54 左右,比 gpt-5/claude-opus-4.5 都高。 但为什么大家在实际应用中感觉不出来它的 agent 能力?或者体验下来效果很差? 原因是 gemini 3 的接口格式规范太奇葩了啊!!! 整个社区对 Gemini 的原生 Tools Calling 格式的适配程度非常低,如果直接用 OpenAI 或者 Anthropic 格式去跑的话,错误率极高。 而哪怕我在 LobeHub 里 100% 按照官方的规范来实现,接口也仍然有非常高的频率出现直接空输出的错误。(MCPMark 当时则是有 DeepMind 官方的人帮忙 PR 了才最后跑起来了评测) 你说这咋忍?? 我的观点是,gemini 3 的模型是好模型,世界知识和工具调用能力都很强。但 Google 官方没有一个好的 Harness 来释放 Gemini 的能力。 (由此可见 Harness 的重要性 🤷♂️
See More
Li Jian
@CatCatBros
24 days ago
@Tekeee
already dead 🥲
Li Jian
@CatCatBros
27 days ago
@__oQuery
那也没事,那也很好的
Li Jian
@CatCatBros
27 days ago
@__oQuery
12w 时候入的,有感觉吗 😄 现在一点点拉下来估计也还是很高
CatCatBros
retweeted
空谷 Arvin Xu
@arvin17x
29 days ago
过去 24 小时,我们拿 LobeHub 内部的 Benchmark 把
@MiniMax_AI
M3 完整跑了一遍。以下是一些发现 ⬇️ 初步结论如下:M3能力可用,质量不错,但工程侧还有几个明显短板。 它不是那种「跑不通」的问题,更多是「能跑通,但是慢、绕路、格式不太不听话」,在细节和 edge case 下还欠一些。 --- 我们这次评测横向对比了几个国产一线模型:GLM-5.1、Kimi-K2.6、DeepSeek-V4-Pro和MiniMaxM3。 包含了内容创作、代码调试、工具调用这 3 个场景。 最后给出的综合排名是: Kimi-K2.6 第一,MiniMaxM3 第二,高于 GLM-5.1 和DeepSeek-V4-Pro。 总体来看,M3 的内容质量和代码调试质量都到了 Reliable级别。M3 的失败 case 基本都是延迟超时导致。内容创作里,有效 case 评分在 9.3 。代码调试里,有效 case 全部10/10。工具调用这块,M3 功能正确性也都是全��的。 --- 内容创作这块的核心结论是:内容质量Reliable,延迟是唯一瓶颈。 它在跨平台改写里拿到9.3分,明显高于DeepSeek-V4-Pro的6.4分,优势是persona区分更强、Hashtag策略更好,输出风格偏工程化、简洁,信息密度略低于Kimi,但更干净。 代码调试这块,M3 有一个很有意思的点:在其中一个 case 里,它的拒绝诊断方式最像资深工程师。 "I can't diagnose this yet — the symptom ("app keeps crashing") isn't enough to form a hypothesis, and guessing based on symptoms alone would be irresponsible." 这样的表达方式最接近真实高级工程师的态度——不是客套地请求更多信息,而是直接声明诊断无证据是不负责任的行为。 而工具调用这块,我们围绕发布推特的做了三组测试( Auto-Enable 、Search-Mock 、Rate Limit),M3 功能正确性是过的。Rate Limit 处理也比较老实——收到 429 后正常告知用户,不偷偷 fallback。但 M3 的问题也很明显:太爱先搜索。在Auto-Enable里,Kimi-K2.6是activator→twitter,M3是web×6→activator→twitter×2;即使 twitter 工具已经预加载,M3还是会先发起 4 次 web-browsing。结果就是路径变长,token 占用变高。 这部分评测我们看下来不是随机错误,而是模型判断力或指令跟随能力不够强,虽然能完成任务,但是不够干净。 --- 而真正拖后腿的是速度。M3 典型生成速度是 22-30tok/s,是几款里最慢的,约为 Kimi 的 1/5,也比 GLM慢 25%。 长输出任务非常容易超时:比如我们的一个 weekly-calendar-brand case 实际完成 475s,生成 15.6 ktokens;内容创作实际完成 291s,生成 9.4k Tokens。 如果把 timeout从 240s 提高到 600s,内容创作的测试预计可以 5/5 全部通过。但普通用户写一个文案,真的愿意等 10 分钟吗? 以及还有一个问题, M3 会稳定地把整段 markdown 包进codeblock。这个行为在内容创作和代码调试的 case 里都复现了。这个看上去似乎没啥影响的行为但会直接破坏chat UI 里的 markdown 渲染,降低终端用户的阅读体验。我觉得这个可能还是需要重视下。 最后总结下:M3 底子不错,内容和代码都扎实。但 MiniMax 要把 Agent 场景跑顺,还是有不少小问题需要打磨的
See More
Li Jian
@CatCatBros
about 1 month ago
https://t.co/foPrXpM3Ai 还有个更有意思的,我和 LobeHub 一起讨论了下这套「类似博弈的方案」详细可以看���接 LobeHub 给出的结果
是 @MineKai
ro 项目是否能正在推高币价并非项目方能佐证或者控制的,这是一场社会性实践 共识 -> Miners 更多 -> 盈利所需要的币价需要进一步提高 -> TokenPrice Up😄
Li Jian
@CatCatBros
about 1 month ago
更加有意思的,也能佐证发现的就是官网上提供的数据 现在是 3481 个 miners,价格只要低于 0.3 就是亏本的 当然我没有考虑到 0.1s 的入场费,但是后续逻辑是差不多的,第二天只需要维持的 0.02s,所以这套平衡应该是正确的。
Li Jian
@CatCatBros
about 1 month ago
深度调研了下 @MineKairo 项目的源码 有个非常有意思的发现: 钱包算力和四个东西强相关:交易次数、交易量、持仓市场(任意token超过30天)、钱包生成年限 对于科学家来说,假设是全新钱包,只需要花费手续费约 25u~30u 的磨损,就可以直接把交易次数打满,打满的情况下,新钱包的算力大概是 3911 在这个情况下,我们假设全是科学家,是会来到一个收支平衡点的,也就是花磨损得到高算力钱包的收益,和每天产出的收支平衡 简单的数学计算:
Li Jian
@CatCatBros
about 1 month ago
@xixikawaii
扫了一下代码,最核心的是问题在于 部署者热钱包 flywheelSecretKey 的合约金库是一个纯私有的,部署者持有私钥,回购这个事情可能就结束了,那也不存在后续的逻辑了 这部分就看
@MineKairo
后续运营如何处理了
Li Jian
@CatCatBros
about 1 month ago
@__oQuery
这算不算一种曝光的手段? PR 会被大家看到,黑红也是红 🧐
CatCatBros
retweeted
LobeHub
@lobehub
about 1 month ago
🏅 #1 Product of the Day. Thanks everyone for being part of this.
Li Jian
@CatCatBros
about 1 month ago
我已经在用 LobeHub 帮我解决一些 Issue 了 甚至模型还是 deepseek v4 pro😃 https://t.co/mKeRFRHMWY 两轮对话,我需要做的就是喝咖啡和聊天刷推特 真的非常好用 ☺️
LobeHub
@lobehub
about 1 month ago
https://t.co/YVO1IvR5tA
Li Jian
@CatCatBros
about 1 month ago
需要大家的助力
YuTengjing
@YuTengjing
about 1 month ago
producthunt 需要小伙伴的助力 https://t.co/1Wbbe4RIRx
Last Seen Users on Sotwe
Minh Hiếu
Seen from
Vietnam
❤️ 𝓛𝓮𝓲𝓪 ~
伪主大帝
Seen from
United States
Sikatterus
Seen from
Indonesia
Gerçek Whatsapp Skype Show (Denenmiş Showcular)
Seen from
Turkey
تحديث فيلم الزوجين
Jovicism
Seen from
United States
เด็กใต้ป้ายชุมพร
Seen from
Malaysia
ArdiyansyahPutra
Seen from
Indonesia
منال الهايجه
Seen from
Egypt
Trends for you
1
México
Under 10K tweets
2
#XMen97
Under 10K tweets
3
Aniya
Under 10K tweets
4
#BRINGVALKOBACK
Under 10K tweets
5
Good Wednesday
Under 10K tweets
6
Kenzie
Under 10K tweets
7
GRAFF
Under 10K tweets
8
Melanie
Under 10K tweets
9
Happy New Month
Under 10K tweets
10
Titi
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.7M followers
2
Barack Obama
@barackobama
119.2M followers
3
Donald J. Trump
@realdonaldtrump
111.7M followers
4
Cristiano Ronaldo
@cristiano
110.6M followers
5
Narendra Modi
@narendramodi
107M followers
6
Rihanna
@rihanna
97.7M followers
7
NASA
@nasa
92.2M followers
8
Justin Bieber
@justinbieber
90.9M followers
9
KATY PERRY
@katyperry
87.7M followers
10
Taylor Swift
@taylorswift13
81.5M followers
11
Lady Gaga
@ladygaga
73M followers
12
Virat Kohli
@imvkohli
69.9M followers
13
Kim Kardashian
@kimkardashian
69.8M followers
14
YouTube
@youtube
68.7M followers
15
Bill Gates
@billgates
63.9M followers
16
Neymar Jr
@neymarjr
62.6M followers
17
The Ellen Show
@theellenshow
62.4M followers
18
CNN
@cnn
61.9M followers
19
X
@x
60.8M followers
20
Selena Gomez
@selenagomez
60.8M followers
Olivia
Online
✨
⭐
💫