百无禁忌(勇版) @gougouduck - Twitter Profile

Pinned Tweet

百无禁忌(勇版) @gougouduck

over 3 years ago

接下来几年希望大家跟我一起见证：”一个傻逼的觉醒和自我救赎“

0

6

0

百无禁忌(勇版) @gougouduck

2 days ago

本来也就发达国家中层普通人的消费水平。可中国远远达不到，税后平均25.5K，税前基本35-38K了。这个数的工资，如果是刚毕业就拿到，基本得985硕+热门专业+前10%+大厂，而且得10-9-5

禿道道🐟

@dearemon

3 days ago

果然还是小孩……

632

1K

49

294

572K

0

1

0

71

gougouduck retweeted

joey00072

@joey00072fp4

15 days ago

when you do OPD with grpo as group size = 1 it is ppo, you are replacing the value function in advantage with the teacher model looking at thing through new lens/ diff view is good thing, but ppo is dead take was always retared

joey00072fp4's tweet photo. when you do OPD with grpo as group size = 1

it is ppo,

you are replacing the value function in advantage with the teacher model

looking at thing through new lens/ diff view is good thing,

but ppo is dead take was always retared https://t.co/c7jUipukMF

7

164

8

131

9K

百无禁忌(勇版) @gougouduck

20 days ago

@Seokjinnim_ 好家伙

0

9

Who to follow

kokukyukeo / RAUM

@kokukyukeo

illustrator [email protected] ✉ 白髪好き

Alfred Lin

@Alfred_Lin

Partner @sequoia. Working w/ founders from idea to IPO & beyond: @airbnb @doordash @citsecurities @kalshi @clay @foundforbiz @Nominal_io @zipline

LeBron Factory

@LeBronFactory

FOLLOW for daily LeBron James videos, stats, facts, storytelling & more. (not associated w LeBron James) 🐐

百无禁忌(勇版) @gougouduck

28 days ago

共勉

朱无忌无忌

@Wujizhuzhu

29 days ago

健康的男人就应该多练腿，多睡觉，多吃碳水，然后疯狂工作，疯狂做爱。一定不要打飞机。

607

2K

113

458

883K

0

43

百无禁忌(勇版) @gougouduck

about 1 month ago

牛逼。压缩就是智能，压缩程度越高，模型越强。之前大家一直不清楚大语言模型是如何压缩数据的，压缩到什么程度了。而此文证明了神经网络权重范数=柯尔莫哥洛夫复杂度。如果可以量化衡量数据被压缩的程度，就可以衡量LLM的智能程度了。

Xingyi Yang @yxy2168

about 1 month ago

I do like this paper. It gives a proof that minimum neural weight norm matches minimum program length, aka Kolmogorov complexity, up to a log factor. Weight decay work because small weights neural nets toward simpler, more compressible explanations. https://t.co/7x8JSFjqVa

yxy2168's tweet photo. I do like this paper.

It gives a proof that minimum neural weight norm matches minimum program length, aka Kolmogorov complexity, up to a log factor.

Weight decay work because small weights neural nets toward simpler, more compressible explanations.

https://t.co/7x8JSFjqVa https://t.co/9YhEoUdgzN

12

339

38

257

20K

0

81

百无禁忌(勇版) @gougouduck

about 2 months ago

@syllabubunny 越来越美了

1

2

0

311

百无禁忌(勇版) @gougouduck

5 months ago

@syllabubunny 那跟屁羊呢

0

1

0

227

gougouduck retweeted

Elon Musk

@elonmusk

6 months ago

Building the future

1K

33K

2K

1K

8M

gougouduck retweeted

Shawn Pang

@0xshawnpang

6 months ago

Cursor昨天发布了一篇文章 - 《Scaling long-running autonomous coding》去探索如何让智能体能像工程师一样连续很长时间干好一个项目。 @wilsonzlin 通过使用planner agent做管理分工，workers agent做编程完成任务让AI连续工作接近一周的时间，写了超过1000个文件100万行代码，做出来了一个网页浏览器。用GPT-5.2 Pro做估算，每一行代码都需要多轮阅读上下文，做尝试/回滚/修复，不同的智能体做规划、执行、评估，每一行代码或许会消耗2-5k token。整个项目接近20亿到50亿token，为了简化分析粗略按照30亿token来算。按照 90% input tokens 10% output / reasoning tokens 使用 GPT-5.2 标准价 Input：$1.75 / 1M tokens Output：$14.00 / 1M tokens 最后的成本在8900美元左右。如果不按照工作量和工作小时来看，“雇佣”这样一个永不停歇的AI工程师一个月成本在35600刀，一年则为42.7万美元。和谷歌雇佣一个L4的工程师成本一样。

0xshawnpang's tweet photo. Cursor昨天发布了一篇文章 - 《Scaling long-running autonomous coding》去探索如何让智能体能像工程师一样连续很长时间干好一个项目。

@wilsonzlin 通过使用planner agent做管理分工，workers agent做编程完成任务让AI连续工作接近一周的时间，写了超过1000个文件100万行代码，做出来了一个网页浏览器。

用GPT-5.2 Pro做估算，每一行代码都需要多轮阅读上下文，做尝试/回滚/修复，不同的智能体做规划、执行、评估，每一行代码或许会消耗2-5k token。整个项目接近20亿到50亿token，为了简化分析粗略按照30亿token来算。

按照
90% input tokens
10% output / reasoning tokens

使用 GPT-5.2 标准价
Input：$1.75 / 1M tokens
Output：$14.00 / 1M tokens

最后的成本在8900美元左右。如果不按照工作量和工作小时来看，“雇佣”这样一个永不停歇的AI工程师一个月成本在35600刀，一年则为42.7万美元。和谷歌雇佣一个L4的工程师成本一样。

4

78

11

77

8K

gougouduck retweeted

AlexZ 🦀

@blackanger

6 months ago

开源了，大家可以参考 https://t.co/A1yIdXBWl1

13

679

118

995

141K

gougouduck retweeted

Sebastian Raschka

@rasbt

6 months ago

https://t.co/5RF7KRzZeu

20

1K

155

1K

94K

gougouduck retweeted

anaum

@anaumghori

6 months ago

some recent reads from this month that I've learned from and that are pretty cool 1. Inside NVIDIA GPUs: Anatomy of high performance matmul kernels https://t.co/p0o0ktBe90 2. Triton Flash Attention Kernel Walkthrough: The Forward Pass https://t.co/CG4ieEldWb 3. This guy substack https://t.co/y89yjEM9x3 4. Deep Dive into Triton Internals (3 Parts) https://t.co/JiX9jhN6pg 5. HunyuanWorld-Mirror: Technical Report https://t.co/u8rZf5Whsl 6. Understanding the CUDA Compiler & PTX with a Top-K Kernel https://t.co/YiBQB8tHHa 7. Geometry Meets Vision: Revisiting Pretrained Semantics in Distilled Fields https://t.co/SEfb3AxULE

14

799

109

1K

45K

百无禁忌(勇版) @gougouduck

6 months ago

@syllabubunny

0

4

0

1

795

百无禁忌(勇版) @gougouduck

6 months ago

无人驾驶真正落地的唯一路径就是，圈一片地儿，放几十万台、数百万台无人汽车，模拟人类生活的真实世界，持续运行一年，事故率远远低于真实世界的时候。所有人都会信任无人驾驶。

3

0

87

百无禁忌(勇版) @gougouduck

6 months ago

@syllabubunny 这样真可以！🤩🤩

0

653

gougouduck retweeted

WquGuru

@wquguru

6 months ago

长期以来，为了让AI代码工具能自主持久运行数小时，各路高手探索出自己的方法，Claude Code之父Boris在最新的推文中提及了11月20日刚开发的官方插件ralph-wiggum 这个插件的核心原理利用Claude Code的Stop Hook机制：当Claude认为任务完成并试图退出会话时，hook会拦截退出，检查是否真正达成预设成功条件。如果未达成，它会自动递增迭代计数，并将相同的原始任务提示重新注入给Claude Claude基于上轮留下的文件变更、git历史和测试失败，继续下一轮自纠错迭代。整个过程在单个会话内循环，无需外部脚本，状态通过本地文件持久化使用方式简单：运行一次/ralph-loop "你的任务描述" --completion-promise "完成信号文本" --max-iterations N（强烈推荐设置上限防无限循环），当Claude输出<promise>完成信号</promise>时，循环结束这个方法适合的场景：有清晰客观标准（如测试全通过）的任务，比如TDD开发、重构代码、构建完整功能。Reddit中应用案例有一夜生成仓库、全自主完成5w美金的高价值合同不过也有局限性：不适合主观或模糊任务（易陷入低效循环）；token消耗高；多会话时hook可能意外接管（建议用git worktrees隔离）；依赖优秀的提示工程（如果不熟悉，可以看看这个A社官方的提示工程最佳实践交互课程https://t.co/91HiurD3IF）这个插件标志着AI代理从分钟级到天级自主的跃进，值得每位Claude Code用户尝试链接：https://t.co/NSpQ6FWZps

8

303

40

425

47K

gougouduck retweeted