Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
zhang 🍒.🌰.
@zhangchn
Zhang, Cherry Nut/Das Auto
Joined May 2007
588
Following
327
Followers
10.6K
Posts
zhang 🍒.🌰.
@zhangchn
2 days ago
@xiaojingcanxue
变好了还是变糟了?
zhang 🍒.🌰.
@zhangchn
2 days ago
@ec12edfae2cb221
班主任还怪讲究呢,历史老师么?
zhang 🍒.🌰.
@zhangchn
3 days ago
我一直怀疑,大多数AI还没解决的问题都卡在最优表示上
勃勃OC
@bboczeng
3 days ago
我来告诉你们,数学界接下来一个最大的问题。 我去年就说过,UC Berkeley数学系助理教授Tony Feng在Google Gemini做visiting professor的时候,拿到了当时最好模型Google Gemini的超长极长无敌长的reasoning版本。 这直接导致Tony Feng解决了7道Erdos问题,三道FirstProof问题,开创性地用半监督方式 ,以及无监督方式,指导AI Agent解决数学问题。 我去年就说过,下一步要解决的问题是,尝试把一个数学命题以lean4的形式拆分成多个lemma,多个lemma以DAG的数学结构组合成一个数学命题,每个数学证明可以拆分成几十个到几千个lemma DAG,每个lemma作为节点又可以让多个agent来证明,这样可以用成千上万个agent来碰撞证明每个lemma,尝试组合成一个完整数学证明的DAG。 所有人都忽视了一个最重要的问题,就是一个LLM的reasoning是不可能无限长的,哪怕是Claude和GPT模型,reasoning是有限的,这是LLM结构和目前inference infra决定的。 但是数学家们早就给出了解决方案:在3000多年前,古希腊的数学家们就知道,完备的数学体系需要写书、写笔记、收学生,以学术社区和讨论组的形式,一条条验证,把自己思考的过程记录下来,给同行完成peer review,这样把自己在数学的工作一条条记录、验证、审议、写书、组织起来,一起构建完整的数学大厦。 过去10年来,人类一直在mathlib中实现这一个愿景,全世界所有数学家都在用lean4构建数学大厦,但是还远远不够。 你党弟提出lemma DAG概念后,能大概预测到一个方向,这个方向就是,驱动AI Agent用lean4把所有它能构建数学体系的领域: 1. 用lean4审核目前人类已有的、能用lean4实现和验证的数学论文,全部用lean4实现并验证一遍; 2. 用lean4尝试构建新的问题,实现一个AI native版本的mathlib证明大全——mathlib2——比现有人类数学家构建的mathlib要大一两个数量级; 3. 当人类尝试定义新的问题的时候,先从mathlib和mathlib2中搜索已有近似证明,尝试拆分成DAG的lemma形式,用mathlib2更加快速便捷地实现部分证明; 4. 最后用大量、超大量的AI Agent尝试大量、巨大量、无限提出新的问题,并且并行in parallel用已有mathlib2去验证或者证伪这些新问题,最后由人类数学大师cherry pick出其中有价值的问题和完整证明方案出来。 回到开头,首尾呼应一下: 人类在单一LLM本体进行超长reasoning已经接近inference复杂度极限,这是人类任何人都无法改变的,OpenAI和Anthropic改变不了,玉皇大帝都改变不了, 能提到LLM超长reasoning的唯一办法,就是让LLM Agent不断总结、不断记录、不断验证出过去产出的结构化、逻辑化、有组织的知识库,作为long term memory,这些知识库就是一个LLM Agent过去的所有reasoning中的有效记忆,并且能用于今后未来的所有构建中。 这和朴素古典的memory机制完全不同,无论构建一套lean4还是构建matlab simulink的有效仿真验证后的设计,还是构建HDL各种硬件描述语言在仿真后验证的电路设计,都更有效、更精准、更专业、更小领域, 而且最重要的是,构建这些结构化的专业学术知识库,恰恰是AI Agent加上一个本地仿真、编译、运行环境的最擅长的事情。 说人话说就是,脑子到极限的前提下,好脑子不如烂笔头。
See More
zhang 🍒.🌰.
@zhangchn
3 days ago
@yjf1978
@D931931
GLM5.2真有那么强吗?
Who to follow
immusoul
@ayuan1000
Science, culture and environment reporter. More posts on Bluesky: https://t.co/qprEjCjh9M
剿匪學院
@laichinan
剿匪尚未成功,同志仍需努力
Jay Cummings
@LongFormMath
Math prof. Author of long-form textbooks on proofs (https://t.co/YqXnxDmOe0), real analysis (https://t.co/3IGQ6BIx5Z) & math history (https://t.co/KkXMGTxCDK).
zhang 🍒.🌰.
@zhangchn
3 days ago
@manateelazycat
trust but verify.
zhang 🍒.🌰.
@zhangchn
3 days ago
@9hills
1页/万还不够么?
zhang 🍒.🌰.
@zhangchn
3 days ago
@Kenntnis22
唯一价值在于增加职场压迫而已
zhang 🍒.🌰.
@zhangchn
3 days ago
@ivanalog_com
@mtrainier2020
星球大战2.0,但是美国的策略是引诱中国ALL IN高科技,但是由于重新建立的市场壁垒,本土消费力不足,中国的边际收益会迅速归零。然后就让人口统计学来终结这一局。
zhang 🍒.🌰.
@zhangchn
4 days ago
@shadowglenelf
那就没有🐸脸了
zhang 🍒.🌰.
@zhangchn
9 days ago
@williamlong
bot?
zhang 🍒.🌰.
@zhangchn
9 days ago
Why do I not feel obliged to work until 5:30pm?
zhang 🍒.🌰.
@zhangchn
9 days ago
Today I literally copy-pasted my own requests from one model's llama-server page to another's to compare their answers.
OpenAI
@OpenAI
11 days ago
We’re sharing new research on a method for anticipating how models may behave in real-world use before release: simulating deployment with recent, de-identified user requests and studying candidate model responses. https://t.co/7RJzBfNniQ
zhang 🍒.🌰.
@zhangchn
9 days ago
People in this thread are pretty weird. BTW, who has got household tap water and natural gas free of charge and how to apply for them?
maddie
@madsssagascar
about 1 month ago
quote so evil it could be used in a childrens comic book to be widely and easily understood as “thats the bad guy”
zhang 🍒.🌰.
@zhangchn
9 days ago
@AriXZone
难怪车本身那么脆,钱都花在刀刃上了
zhang 🍒.🌰.
@zhangchn
9 days ago
@10xmylife
建议变量名使用片假名,emoji和带变音标记的那些ISO8859-15的特有字母
zhang 🍒.🌰.
@zhangchn
9 days ago
@corndogjpn2
企业总有不能联网的那一部分
zhang 🍒.🌰.
@zhangchn
9 days ago
@ec12edfae2cb221
[f"今年{x + 1}月要远离{y}" for (x,y) in ["C", "C++", "Java", "Go", "Rust", "TypeScript", "SQL", "Haskell", "OCaml", "C#", "Python", "Perl"].enum()]
zhang 🍒.🌰.
@zhangchn
9 days ago
https://t.co/7QvXAR6NfD 但是,macOS直接在命令行mdfind -name基本上等同于everything啊。
zhang 🍒.🌰.
@zhangchn
10 days ago
@shadowglenelf
和微信一样,身份认证入口,不能砍的
zhang 🍒.🌰.
@zhangchn
10 days ago
老实说,我是不怎么追新模型的。一线商业模型基本上不碰,开源模型挑最便宜的。反正不管怎么着,半年以后都会比现在翻天覆地的好,不如等一等,如果花钱太慢,就等于完全不用花钱。
Last Seen Users on Sotwe
훈흔
Seen from
Korea
linda
Seen from
Turkey
Cem
Seen from
Netherlands
Hijab NSFW
Seen from
Germany
Olgun Kadın Sever
Seen from
Turkey
Karla
Seen from
Mexico
türk ifşa paylaşım yerel
Seen from
Turkey
Azgın ADAM ile eşinden gizli
Seen from
Turkey
Saheb Das
Seen from
Turkey
Brooke Braun
Seen from
Netherlands
Trends for you
1
Titi
Under 10K tweets
2
More Info in Article Below
Under 10K tweets
3
#loveislandusa
Under 10K tweets
4
WNBA
Under 10K tweets
5
Haiti
Under 10K tweets
6
Temporary
Under 10K tweets
7
Scott
Under 10K tweets
8
Good Saturday
Under 10K tweets
9
Venezuela
Under 10K tweets
10
Thune
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.5M followers
2
Barack Obama
@barackobama
119.3M followers
3
Donald J. Trump
@realdonaldtrump
111.7M followers
4
Cristiano Ronaldo
@cristiano
110.4M followers
5
Narendra Modi
@narendramodi
107M followers
6
Rihanna
@rihanna
97.6M followers
7
NASA
@nasa
92.1M followers
8
Justin Bieber
@justinbieber
90.9M followers
9
KATY PERRY
@katyperry
87.5M followers
10
Taylor Swift
@taylorswift13
81.4M followers
11
Lady Gaga
@ladygaga
72.9M followers
12
Kim Kardashian
@kimkardashian
69.7M followers
13
Virat Kohli
@imvkohli
69.7M followers
14
YouTube
@youtube
68.7M followers
15
Bill Gates
@billgates
63.8M followers
16
The Ellen Show
@theellenshow
62.5M followers
17
Neymar Jr
@neymarjr
62.4M followers
18
CNN
@cnn
61.9M followers
19
X
@x
60.8M followers
20
Selena Gomez
@selenagomez
60.6M followers
Olivia
Online
✨
⭐
💫