Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
Li Jian
@CatCatBros
在和朋友做一些很酷的事情 making @lobehub @openomy_hub better Bitcoin Lover & Web3 Friendly github:
America
Joined December 2020
724
Following
150
Followers
789
Posts
Li Jian
@CatCatBros
3 days ago
找到了当时找工作时候一些公司面试的记录。 时过境迁,一晃已经是 5 年了
Li Jian
@CatCatBros
19 days ago
@xiangyuli
非常���同 这是为数不多,会因为员工反馈从而调整的例子了,以往员工内网吐槽都是没有后续的,我也并不觉得这是无情无义 难道为了所谓的员工第二就只能是口头吗? 🧐 没有任何反馈的话,对员工来说是否又是有情有义了呢?
Li Jian
@CatCatBros
23 days ago
@MaxForAI
身上看到了傲慢 🧐
Li Jian
@CatCatBros
23 days ago
vibe coding 后,我电脑每隔一周就得重启一次,不然开发的额时候会立刻起飞,有人有类似的问题吗? AI 分析后说是 spotlight 的索引机制问题 说是因为 spotlight 会在某些情况下索引 node_modules 全量扫描 🧐 但为什么 vibe 之前,古法编程就没出现过几次。。。
CatCatBros
retweeted
空谷 Arvin Xu
@arvin17x
24 days ago
这���必须得出来说下,Gemini 3 系列的模型问题并不是不爱做工具调用,而是工程层做的太烂了。 去年 Gemini 3 出来的时候,我们在 MCPMark (评测 Model 使用 MCP 的工具调用能力)跑过它的分,是非常高的,pass@1 有 54 左右,比 gpt-5/claude-opus-4.5 都高。 但为什么大家在实际应用中感觉不出来它的 agent 能力?或者体验下来效果很差? 原因是 gemini 3 的接口格式规范太奇葩了啊!!! 整个社区对 Gemini 的原生 Tools Calling 格式的适配程度非常低,如果直接用 OpenAI 或者 Anthropic 格式去跑的话,错误率极高。 而哪怕我在 LobeHub 里 100% 按照官方的规范来实现,接口也仍然有非常高的频率出现直接空输出的错误。(MCPMark 当时则是有 DeepMind 官方的人帮忙 PR 了才最后跑起来了评测) 你说这咋忍?? 我的观点是,gemini 3 的模型是好模型,世界知识和工具调用能力都很强。但 Google 官方没有一个好的 Harness 来释放 Gemini 的能力。 (由此可见 Harness 的重要性 🤷♂️
See More
Li Jian
@CatCatBros
24 days ago
@Tekeee
already dead 🥲
Li Jian
@CatCatBros
27 days ago
@__oQuery
那也没事,那也很好的
Li Jian
@CatCatBros
27 days ago
@__oQuery
12w 时候入的,有感觉吗 😄 现在一点点拉下来估计也还是很高
CatCatBros
retweeted
空谷 Arvin Xu
@arvin17x
29 days ago
过去 24 小时,我们拿 LobeHub 内部的 Benchmark 把
@MiniMax_AI
M3 完整跑了一遍。以下是一些发现 ⬇️ 初步结论如下:M3能力可用,质量不错,但工程侧还有几个明显短板。 它不是那种「跑不通」的问题,更多是「能跑通,但是慢、绕路、格式不太不听话」,在细节和 edge case 下还欠一些。 --- 我们这次评测横向对比了几个国产一线模型:GLM-5.1、Kimi-K2.6、DeepSeek-V4-Pro和MiniMaxM3。 包含了内容创作、代码调试、工具调用这 3 个场景。 最后给出的综合排名是: Kimi-K2.6 第一,MiniMaxM3 第二,高于 GLM-5.1 和DeepSeek-V4-Pro。 总体来看,M3 的内容质量和代码调试质量都到了 Reliable级别。M3 的失败 case 基本都是延迟超时导致。内容创作里,有效 case 评分在 9.3 。代码调试里,有效 case 全部10/10。工具调用这块,M3 功能正确性也都是全��的。 --- 内容创作这块的核心结论是:内容质量Reliable,延迟是唯一瓶颈。 它在跨平台改写里拿到9.3分,明显高于DeepSeek-V4-Pro的6.4分,优势是persona区分更强、Hashtag策略更好,输出风格偏工程化、简洁,信息密度略低于Kimi,但更干净。 代码调试这块,M3 有一个很有意思的点:在其中一个 case 里,它的拒绝诊断方式最像资深工程师。 "I can't diagnose this yet — the symptom ("app keeps crashing") isn't enough to form a hypothesis, and guessing based on symptoms alone would be irresponsible." 这样的表达方式最接近真实高级工程师的态度——不是客套地请求更多信息,而是直接声明诊断无证据是不负责任的行为。 而工具调用这块,我们围绕发布推特的做了三组测试( Auto-Enable 、Search-Mock 、Rate Limit),M3 功能正确性是过的。Rate Limit 处理也比较老实——收到 429 后正常告知用户,不偷偷 fallback。但 M3 的问题也很明显:太爱先搜索。在Auto-Enable里,Kimi-K2.6是activator→twitter,M3是web×6→activator→twitter×2;即使 twitter 工具已经预加载,M3还是会先发起 4 次 web-browsing。结果就是路径变长,token 占用变高。 这部分评测我们看下来不是随机错误,而是模型判断力或指令跟随能力不够强,虽然能完成任务,但是不够干净。 --- 而真正拖后腿的是速度。M3 典型生成速度是 22-30tok/s,是几款里最慢的,约为 Kimi 的 1/5,也比 GLM慢 25%。 长输出任务非常容易超时:比如我们的一个 weekly-calendar-brand case 实际完成 475s,生成 15.6 ktokens;内容创作实际完成 291s,生成 9.4k Tokens。 如果把 timeout从 240s 提高到 600s,内容创作的测试预计可以 5/5 全部通过。但普通用户写一个文案,真的愿意等 10 分钟吗? 以及还有一个问题, M3 会稳定地把整段 markdown 包进codeblock。这个行为在内容创作和代码调试的 case 里都复现了。这个看上去似乎没啥影响的行为但会直接破坏chat UI 里的 markdown 渲染,降低终端用户的阅读体验。我觉得这个可能还是需要重视下。 最后总结下:M3 底子不错,内容和代码都扎实。但 MiniMax 要把 Agent 场景跑顺,还是有不少小问题需要打磨的
See More
Li Jian
@CatCatBros
30 days ago
https://t.co/foPrXpM3Ai 还有个更有意思的,我和 LobeHub 一起讨论了下这套「类似博弈的方案」详细可以看���接 LobeHub 给出的结果
是 @MineKai
ro 项目是否能正在推高币价并非项目方能佐证或者控制的,这是一场社会性实践 共识 -> Miners 更多 -> 盈利所需要的币价需要进一步提高 -> TokenPrice Up😄
Li Jian
@CatCatBros
30 days ago
更加有意思的,也能佐证发现的就是官网上提供的数据 现在是 3481 个 miners,价格只要低于 0.3 就是亏本的 当然我没有考虑到 0.1s 的入场费,但是后续逻辑是差不多的,第二天只需要维持的 0.02s,所以这套平衡应该是正确的。
Li Jian
@CatCatBros
30 days ago
深度调研了下 @MineKairo 项目的源码 有个非常有意思的发现: 钱包算力和四个东西强相关:交易次数、交易量、持仓市场(任意token超过30天)、钱包生成年限 对于科学家来说,假设是全新钱包,只需要花费手续费约 25u~30u 的磨损,就可以直接把交易次数打满,打满的情况下,新钱包的算力大概是 3911 在这个情况下,我们假设全是科学家,是会来到一个收支平衡点的,也就是花磨损得到高算力钱包的收益,和每天产出的收支平衡 简单的数学计算:
Li Jian
@CatCatBros
30 days ago
@xixikawaii
扫了一下代码,最核心的是问题在于 部署者热钱包 flywheelSecretKey 的合约金库是一个纯私有的,部署者持有私钥,回购这个事情可能就结束了,那也不存在后续的逻辑了 这部分就看
@MineKairo
后续运营如何处理了
Li Jian
@CatCatBros
about 1 month ago
@__oQuery
这算不算一种曝光的手段? PR 会被大家看到,黑红也是红 🧐
CatCatBros
retweeted
LobeHub
@lobehub
about 1 month ago
🏅 #1 Product of the Day. Thanks everyone for being part of this.
Li Jian
@CatCatBros
about 1 month ago
我已经在用 LobeHub 帮我解决一些 Issue 了 甚至模型还是 deepseek v4 pro😃 https://t.co/mKeRFRHMWY 两轮对话,我需要做的就是喝咖啡和聊天刷推特 真的非常好用 ☺️
LobeHub
@lobehub
about 1 month ago
https://t.co/YVO1IvR5tA
Li Jian
@CatCatBros
about 1 month ago
需要大家的助力
YuTengjing
@YuTengjing
about 1 month ago
producthunt 需要小伙伴的助力 https://t.co/1Wbbe4RIRx
Last Seen Users on Sotwe
Kim hong
NollyPorn 🇳🇬
لينوس 🧁
Seen from
France
รักสาวใหญ่รุ่นแม่ อวบอ้วน
คลิปหลุดทางบ้าน งานเด็ด ๆ
Seen from
Thailand
Growing Jock
Seen from
Spain
25🇪🇬ميدو
Seen from
Egypt
Vợ Chồng Some Swing
Guri Ativo
Seen from
Saudi Arabia
Suka eksib
Seen from
United States
Trends for you
1
Ecuador
Under 10K tweets
2
Aniya
Under 10K tweets
3
Y SI SI
Under 10K tweets
4
Titi
Under 10K tweets
5
Zach
Under 10K tweets
6
Melanie
Under 10K tweets
7
Contreras
Under 10K tweets
8
Santi
Under 10K tweets
9
Dean Wade
Under 10K tweets
10
#BRINGBACKVALKO
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.7M followers
2
Barack Obama
@barackobama
119.2M followers
3
Donald J. Trump
@realdonaldtrump
111.7M followers
4
Cristiano Ronaldo
@cristiano
110.6M followers
5
Narendra Modi
@narendramodi
107M followers
6
Rihanna
@rihanna
97.7M followers
7
NASA
@nasa
92.2M followers
8
Justin Bieber
@justinbieber
90.9M followers
9
KATY PERRY
@katyperry
87.7M followers
10
Taylor Swift
@taylorswift13
81.5M followers
11
Lady Gaga
@ladygaga
73M followers
12
Virat Kohli
@imvkohli
69.9M followers
13
Kim Kardashian
@kimkardashian
69.8M followers
14
YouTube
@youtube
68.7M followers
15
Bill Gates
@billgates
63.9M followers
16
Neymar Jr
@neymarjr
62.6M followers
17
The Ellen Show
@theellenshow
62.4M followers
18
CNN
@cnn
61.9M followers
19
X
@x
60.8M followers
20
Selena Gomez
@selenagomez
60.7M followers
Olivia
Online
✨
⭐
💫