tortoise @tortoise_git - Twitter Profile

tortoise @tortoise_git

about 2 months ago

@xiaoshunli 井底之蛙

0

350

tortoise_git retweeted

Alessandro Ferrari

@BioAlessandro

4 months ago

Building a compiler + HSL framework to turn @__tinygrad__ kernels into VHDL, and synthesize the perfect FPGA for a given compute graph. Tinygrad UOps -> KernelIR (my custom IR) -> Amaranth hardware modules

BioAlessandro's tweet photo. Building a compiler + HSL framework to turn @__tinygrad__ kernels into VHDL, and synthesize the perfect FPGA for a given compute graph.

Tinygrad UOps -> KernelIR (my custom IR) -> Amaranth hardware modules https://t.co/9YhncOo0s8

14

494

29

262

25K

tortoise_git retweeted

Festus

@_enfinity

4 months ago

When people say “Triton is a compiler”, they mean something very specific. Triton is not just another way to write Python that happens to use CUDA underneath, it is a real compiler stack for GPU kernels! 🧵 Image credit: @PyTorch Source: https://t.co/kORJDZy6vD

_enfinity's tweet photo. When people say “Triton is a compiler”, they mean something very specific.

Triton is not just another way to write Python that happens to use CUDA underneath, it is a real compiler stack for GPU kernels! 🧵

Image credit: @PyTorch
Source: https://t.co/kORJDZy6vD https://t.co/Zi6uwX4HDv

1

164

23

113

9K

tortoise_git retweeted

Gautam Ramachandra

@gautam1858

4 months ago

https://t.co/vKcYX4dBEs

5

156

21

264

61K

Who to follow

Bachelor of Science in Computer Science, way too many hobbies and interests. The latest one is is being a TV/Film extra and producer. @[email protected]

Larry Harris

@LarryGHarris2

Cruise missile for hire, Love me some Seminoles.

tortoise_git retweeted

常为希｜AI之道

@CryptoYunqi

4 months ago

Karpathy当年用纯C语言（不依赖任何框架）实现了llama2.c，证明了可以从零训练一个真正的Transformer模型。最近一位独立研究者（借助Claude Code辅助），拿同样的Stories 110M参数、Llama2架构模型，用真实文本训练后，直接在苹果M4的神经引擎（ANE）上跑推理，功耗不到1瓦。这位研究者逆向工程了苹果未公开的私有API，绕过了CoreML，发现苹果官方抽象层其实屏蔽了芯片2–4倍的真实吞吐能力。实际测试显示，M4 ANE的效率达到每瓦6.6 TFLOPS，大约是NVIDIA A100的80倍。最关键的意义在于推理端：全球已有数亿台苹果设备搭载了人类消费级硬件中最强效的AI加速器之一，而真正限制开发者发挥其全部潜力的，反而是苹果自己的软件栈（API和抽象层）。 @maderix

CryptoYunqi's tweet photo. Karpathy当年用纯C语言（不依赖任何框架）实现了llama2.c，证明了可以从零训练一个真正的Transformer模型。

最近一位独立研究者（借助Claude Code辅助），拿同样的Stories 110M参数、Llama2架构模型，用真实文本训练后，直接在苹果M4的神经引擎（ANE）上跑推理，功耗不到1瓦。

这位研究者逆向工程了苹果未公开的私有API，绕过了CoreML，发现苹果官方抽象层其实屏蔽了芯片2–4倍的真实吞吐能力。实际测试显示，M4 ANE的效率达到每瓦6.6 TFLOPS，大约是NVIDIA A100的80倍。

最关键的意义在于推理端：全球已有数亿台苹果设备搭载了人类消费级硬件中最强效的AI加速器之一，而真正限制开发者发挥其全部潜力的，反而是苹果自己的软件栈（API和抽象层）。

@maderix

11

318

47

302

48K

tortoise_git retweeted

Tom Dörr

@tom_doerr

5 months ago

Operating system built with Claude Code for Aarch64 https://t.co/nCxAdrhYdP

8

205

18

97

18K

tortoise_git retweeted

GitHubDaily

@GitHub_Daily

5 months ago

用 AI 辅助编程，代码写得快不是问题，问题是��次都像"打游击战"，项目一复杂就陷入混乱，改来改去最后连自己都看不懂。偶然看到 AI Code Guide 这份开源指南，系统性地整理了 AI 辅助编程的完整方法论，从工具选择到实战流程都讲得很透彻。核心理念是"规划先行"：不是直接让 AI 写代码，而是先用 ChatGPT 生成产品需求文档(PRD)和任务清单，再让 AI 按步骤实现，确保项目始终保持清晰的结构。 GitHub：https://t.co/wXLj0sFPsM 指南涵盖了从零开始的完整工作流：如何选择合适的 LLM 模型、怎样编写有效的提示词、如何设置项目规则避免幻觉、怎样处理错误和 Bug，还详细对比了 Cursor、Windsurf、Claude Code 等主流工具的使用场景。特别实用的是"vibe coding"实战部分，手把手教你用 ChatGPT 生成 PRD，再用 Cursor Agent 自动实现，10 分钟就能搭建一个 CLI 工具原型。如果你想把 AI 编程从"随机碰运气"升级为"系统化工程实践"，这份指南值得收藏。

GitHub_Daily's tweet photo. 用 AI 辅助编程，代码写得快不是问题，问题是��次都像"打游击战"，项目一复杂就陷入混乱，改来改去最后连自己都看不懂。

偶然看到 AI Code Guide 这份开源指南，系统性地整理了 AI 辅助编程的完整方法论，从工具选择到实战流程都讲得很透彻。

核心理念是"规划先行"：不是直接让 AI 写代码，而是先用 ChatGPT 生成产品需求文档(PRD)和任务清单，再让 AI 按步骤实现，确保项目始终保持清晰的结构。

GitHub：https://t.co/wXLj0sFPsM

指南涵盖了从零开始的完整工作流：如何选择合适的 LLM 模型、怎样编写有效的提示词、如何设置项目规则避免幻觉、怎样处理错误和 Bug，还详细对比了 Cursor、Windsurf、Claude Code 等主流工具的使用场景。

特别实用的是"vibe coding"实战部分，手把手教你用 ChatGPT 生成 PRD，再用 Cursor Agent 自动实现，10 分钟就能搭建一个 CLI 工具原型。

如果你想把 AI 编程从"随机碰运气"升级为"系统化工程实践"，这份指南值得收藏。

5

235

59

379

44K

tortoise @tortoise_git

5 months ago

@nihui 在Core Ultra 7的NPU还是GPU的结果��

0

277

tortoise_git retweeted

Uros Popovic

@popovicu94

5 months ago

https://t.co/8BotzEuos1

6

128

3

83

11K

tortoise_git retweeted

Vivek Galatage

@vivekgalatage

5 months ago

Excellent article by Sebastian Aaltonen https://t.co/7LnYpRRkZN

0

176

19

135

8K

tortoise_git retweeted

plantegg

@plantegg

5 months ago

📖 一个改变 Intel CPU 设计的故事 2014 年,阿里工程师发现: - L2 增加 256KB,芯片面积 +5%,性能 +61% - L3 增加 2.3MB,芯片面积 +46%,性能仅 +7% 结论: L3 性价比太低! 2015 年,Intel 发表论文证明这个发现,并在 Skylake 架构中: • L2 从 256KB → 1MB (4 倍) • L3 从 2.5MB/core → 1.375MB/core (压缩 45%) 这篇文章告诉你: - Cache 设计背后的权衡 - 为什么 SRAM 贵 1000 倍还要用 - 从 L1 到内存的延迟阶梯 - 真实业务场景的性能瓶颈包含: ✅ Intel/AMD/ARM/国产 CPU 详细对比 ✅ 矩阵乘法 5 种优化实测 ✅ 内存延迟测试工具和代码 https://t.co/JWIDG3G4Ad

24

328

40

268

68K

tortoise_git retweeted

tetsuo

@tetsuoai

5 months ago

probability distribution relationship diagram

57

4K

525

2K

157K

tortoise_git retweeted

Vivek Galatage

@vivekgalatage

5 months ago

Roadmap from Cornell - Introduction to CUDA https://t.co/Spw4ramTBl

6

897

133

1K

42K

tortoise @tortoise_git

6 months ago

@NoContextHumans For safety purposes, removing static before boarding passengers

0

1

0

122

tortoise_git retweeted

Vivek Galatage

@vivekgalatage

7 months ago

The foundational book for learning 2D graphics, transforms, OpenGL, 3D Graphics, the latest WebGPU, and more. https://t.co/MgLCes4B0g

vivekgalatage's tweet photo. The foundational book for learning 2D graphics, transforms, OpenGL, 3D Graphics, the latest WebGPU, and more.

https://t.co/MgLCes4B0g https://t.co/fc4mxxirQA

2

414

49

453

32K

tortoise_git retweeted

Tom Yeh

@ProfTomYeh

7 months ago

RNN by hand ✍️ ⬇️ Download: https://t.co/Fc7BU9fgbn

11

1K

184

693

46K

tortoise_git retweeted

Vivek Galatage

@vivekgalatage

8 months ago

The details about how Compiler Explorer works are fascinating and absolutely amazing... https://t.co/oaeow7m7z5

3

456

63

407

31K

tortoise_git retweeted

Vivek Galatage

@vivekgalatage

8 months ago

Excellent explanation of Array of Structures (AoS) and Structure of Arrays (SoA). https://t.co/nlsMzU4GMH

2

829

99

797

63K

tortoise_git retweeted

GitHubDaily

@GitHub_Daily

9 months ago

使用 Claude Code、Cursor 这些 AI 工具写代码时，很多人都是直接这样说：帮我开发一个 AI 聊天应用。瞬间能看到几百行代码生成，给人感觉确实很不错，若再让它加个登录注册功能，却发现所有代码直接重写。这就是 “氛围编程” 给大家带来的困扰，为此 GitHub 团队开源了 Spec Kit 这款工具，专门用来规范化我们使用 AI 工具的开发流程。让我们先用自然语言写清楚具体 “做什么” 和 “为什么”，然后再交给 AI 写代码。并且通过统一的规格模板和强制评审机制，把模糊需求逐步转化为高质量、可追溯的代码实现。 GitHub：https://t.co/7TX0b83jZ9 整个开发过程都有完整的记录和追溯，即使六个月后回头看项目，也能清楚理解当初每个设计决策的来龙去脉。目前该工具开源不到一个月时间，便收获了 19.8k+ Star，已支持 Claude Code、Gemini CLI、Cursor 等 AI 工具。通过 uvx 安装后即可使用，提供了详细的教程文档，值得每位使用 AI 编程工具的同学看看。

20

936

227

1K

108K

tortoise_git retweeted

GitHubDaily

@GitHub_Daily

11 months ago

想系统学习强化学习，却发现大多数资料要么过于简单只讲表面，要么数学太复杂让人望而却步，学习起来非常困难。今天，看到 Mathematical Foundations of Reinforcement Learning 这本开源教材正好解决这个学习难题，讲得颇为清晰，还配了超多视频教程。它从数学视角讲解 RL 的基本概念和经典算法，并结合大量示例一步步帮助理解，让复杂的算法变得生动易懂。 GitHub：https://t.co/WdQy1bHuWR 主要内容： - RL 基础概念：状态、动作、策略等全梳理 - MC / TD / Q-learning 等经典算法深入拆解 - 配套 50+ 集英文和中文视频课程，理论实践同步推进 - 大量网格世界实例演示，帮助理解抽象概�� - 数学推导严谨但友好，控制难度适中 - 提供 Python、R、C++ 等多语言代码实现适合想深入理解强化学习理论的同学，不过需要有一定概率论和线性代数基础。

GitHub_Daily's tweet photo. 想系统学习强化学习，却发现大多数资料要么过于简单只讲表面，要么数学太复杂让人望而却步，学习起来非常困难。

今天，看到 Mathematical Foundations of Reinforcement Learning 这本开源教材正好解决这个学习难题，讲得颇为清晰，还配了超多视频教程。

它从数学视角讲解 RL 的基本概念和经典算法，并结合大量示例一步步帮助理解，让复杂的算法变得生动易懂。

GitHub：https://t.co/WdQy1bHuWR

主要内容：

- RL 基础概念：状态、动作、策略等全梳理
- MC / TD / Q-learning 等经典算法深入拆解
- 配套 50+ 集英文和中文视频课程，理论实践同步推进
- 大量网格世界实例演示，帮助理解抽象概��
- 数学推导严谨但友好，控制难度适中
- 提供 Python、R、C++ 等多语言代码实现

适合想深入理解强化学习理论的同学，不过需要有一定概率论和线性代数基础。

7

654

197

578

63K

tortoise

@tortoise_git

Who to follow

Last Seen Users on Sotwe

Trends for you

Most Popular Users