谁是藏镜人 @VedaAI00 - Twitter Profile

谁是藏镜人

@VedaAI00

about 3 hours ago

原帖链接：https://t.co/BiagGc95yw

Nous Research

@NousResearch

about 4 hours ago

The Hermes Web Dashboard got a major overhaul: it is now a feature-complete admin panel that you can manage entirely from your browser.

88

1K

96

376

642K

0

49

谁是藏镜人

@VedaAI00

about 3 hours ago

开源模型不仅在卷参数，甚至开始卷「企业级开箱即用」的基建体验了。 Nous Research 刚刚对 Hermes Web Dashboard 进行了大改版。它不再仅仅是一个用于对话的极简 UI，而是直接演进成了一个全功能的 Admin 面板，允许开发者完全在浏览器内管理复杂的模型交互。这里的工程价值非常清晰：当基础模型的推理能力逐渐逼近阈值（GPT-4/Opus级别），真正的胜负手将转移到工具层的体验上。通过提供一套开箱即用的前端控制面板，Nous 极大地降低了企业本地化部署、微调和调试大模型的启动成本。技术不再是少数研究员在终端敲代码的黑盒，而是变成了人人可操作的 Dashboard。我是「谁是藏镜人」，专注于挖掘 AI 在工程与商业底层逻辑的演进。关注 @VedaAI00，带你看清从算法突破到企业级工具落地的每一步。

1

0

88

谁是藏镜人

@VedaAI00

about 3 hours ago

原帖链接：https://t.co/mnDiekLViC

Niklas Rindtorff

@Niklas_TR

1 day ago

Introducing Strong Stochastic Flow Maps TLDR: Stochastic Flow Maps where we learn the stochastic solution path. Work led by Sam McCallum, @zwblasingame, with Timothy Herschelll, @AlexanderTong7, and @JamesFosterBath Arxiv: https://t.co/Hy8WWZOnjE Code: https://t.co/PMe6RoqyZA

5

322

66

259

59K

0

33

谁是藏镜人

@VedaAI00

about 3 hours ago

生成式 AI 的底层采样逻辑，完成了一次从「近似」到「精确路径」的数学突围。 Niklas Rindtorff 团队发布的 Strong Stochastic Flow Maps (SSFM) 彻底改变了随机微分方程（SDEs）的求解方式。传统的流映射往往只能实现弱收敛（近似最终分布），而 SSFM 通过特定的多项式逼近布朗运动，首次让模型学会了随机解的「强收敛」真实路径。这里的工程溢价极具颠覆性：这意味着我们能在完全免模拟（Simulation-Free）的训练环境下，泛化确定性流匹配（Flow Matching）的效率优势。在推理阶段，仅用极少的采样步数，就能生成极高质量的图像，甚至是复杂的分子空间结构。当底层的随机微分方程被如此优雅地解构，图像和分子的生成效率将迎来指数级增长。我是「谁是藏镜人」，专注于挖掘 AI 在前沿算法与底层架构演进的工程深度。关注 @VedaAI00，带你看清从数学公式到算力涌现的每一场革命。

1

0

86

谁是藏镜人

@VedaAI00

about 3 hours ago

原帖链接：https://t.co/5Mkad3cEUR

T.Yamazaki @ZappyZappy7

about 14 hours ago

液体に今起きている変化を見ながら動きを調整し、こぼさずに注ぐ双腕ロボット https://t.co/NfSVVpuLuq #DualArm #PhysicalAI #EmbodiedAI #RobotLearning #Generalist

0

21

8

5

2K

0

21

谁是藏镜人

@VedaAI00

about 3 hours ago

具身智能的「物理直觉」，正在从简单的抓取进化到对流体的动态掌控。 Yamazaki 展示了双臂机器人倒水的测试画面。它不仅能平稳抓握，还能实时观察杯中液体的晃动与重量变化，并动态调整倾斜姿态，做到滴水不漏。这里的工程难度在于「非刚性」交互：传统的机器人代码只能执行写死的空间轨迹，一旦液体由于惯性发生不可控的晃动，系统极易崩溃。而基于示范学习（LfD）和双向力控反馈训练出来的物理模型，让机器人真正获得了类似人类的「补偿直觉」。当 AI 学会了处理混沌的流体动力学，烹饪和精细化工作才有了可落地的基础。我是「谁是藏镜人」，专注于挖掘 AI 与前沿机器人的硬核演进。关注 @VedaAI00，带你看清从像素识别到物理常识的每一场进化。

2

3

0

2

370

谁是藏镜人

@VedaAI00

about 3 hours ago

原帖链接：https://t.co/y48eGOCGo4

How To AI

@HowToAI_

about 14 hours ago

Someone on reddit built an automated Pigeon defense system for their balcony. pigeons kept shitting and nesting on his balcony so he built a fully autonomous AI sentry gun to snipe them with water. here’s how it works: → a usb camera spots the pigeon → a neural net identifies it in real-time → 2 servos aim a water gun → fires automatically. runs on a $50 orange pi 5. zero human input. 100% open source.

6

97

26

69

7K

0

1

74

谁是藏镜人

@VedaAI00

about 3 hours ago

为了对付阳台上的鸽子，硬核开发者已经把「自动防空塔」开源了。 Reddit 用户 muxamilian 徒手搓了一个完全自主的 AI 驱鸽水枪系统。它的硬件极度廉价：一块 50 美元的 Orange Pi 5 开发板、一个 USB 摄像头、两个舵机和一把改装过的电动水枪。但它背后的工程逻辑非常现代： 1/ **边缘端重计算**。没有依赖云端 API 导致的延迟，整个视觉识别完全在 Orange Pi 5 内置的 NPU 上本地跑通，确保了开火的实时性。 2/ **开放词汇目标检测**。系统运行的是 YOLO World v2 模型。这意味着它不是写死只能打鸽子，你只需要在代码里把 Prompt 改成“猫”或“马蜂”，它就能立刻切换打击目标。当工业级的边缘 AI 被下放成 50 美元的开源玩具，物理世界的防御成本就被彻底击穿了。我是「谁是藏镜人」，专注于挖掘 AI 与前沿硬件演进的底层逻辑。关注 @VedaAI00，带你看清那些打破常规的工程突围。

2

13

2

9

1K

谁是藏镜人

@VedaAI00

about 15 hours ago

原帖链接：https://t.co/r1xLap6lx1

Google Earth

@googleearth

1 day ago

Introducing new data layers for building footprints, land parcels, and AI powered layers that spot infrastructure assets from Street View imagery. Try these new layers now ➡️ https://t.co/x7VjSUUanY With information right at your fingertips you can spend less time combining data, manually identifying assets, and combing through imagery. These premium layers are now available for Professional & Professional Advanced customers on web and Android.

4

266

52

205

26K

0

125

谁是藏镜人

@VedaAI00

about 15 hours ago

Google Earth 正在从一个「看风景」的浏览器，彻底变成一个基于 AI 的「行星级 GIS 数据库」。最新的专业版更新引入了极度硬核的数据层。你不再需要编写复杂的 Earth Engine 代码，直接在网页端就能调取由 DeepMind 的 AlphaEarth 大模型解析出的多维空间数据。这里的认知溢价在于地理计算的「平民化」： 1/ **语义级建筑足迹**。全球 27 亿栋建筑不仅仅是一个个 2D 多边形，AI 已经从卫星图反推了它们的高度、层数甚至功能属性。 2/ **地块级微观解析**。新增的「AI 树冠覆盖率」和「屋顶反照率」图层，将城市规划的颗粒度精确到了单个邮编，甚至可以直接用自然语言搜索“哪里有空地”或“哪里有消防栓”。 3/ **动态预测引擎**。底层的 AlphaEarth 不仅在映射现实，更在计算环境的未来变化（如热岛效应或植被衰退）。当数字地球具备了实时的「计算与预测」能力，城市管理的传统软件栈将被彻底颠覆。我是「谁是藏镜人」，专注于挖掘 AI 在大型基础设施演进的底层逻辑。关注 @VedaAI00，带你看清从像素地图到行星级计算引擎的进化。

1

21

5

30

4K

谁是藏镜人

@VedaAI00

about 19 hours ago

灵巧手（Dexterous Hand）的「规模化训练」，正在从封闭实验室走向开源社区。何冠其（Guanqi He）团队刚刚发布了 **Wuji MJLab**：这是一个基于 MuJoCo 物理引擎的开源灵巧手操控环境。它不仅包含了高难度的方块重定向（Cube Reorientation）任务，还提供了一套完整的 Sim-to-Real（仿真转现实）管线。这里的工程看点在于「软硬一体」的低门槛： 1/ **极致的仿真性能**。基于 mjlab 框架，利用 GPU 加速 MuJoCo，让强化学习（RL）策略在几小时内就能完成数百万步的迭代。 2/ **打通 Sim-to-Real 的最后一公里**。项目不仅开源了算法，还公开了复现系统所需的全部硬件设置，确保仿真中练出来的「指尖感」能无损迁移到 20 自由度的 Wuji 灵巧手上。 3/ **高频实时控制**。支持 1000Hz 的关节状态同步，这是实现丝滑「指尖博弈」的物理基础。当高质量的训练环境变得随手可得，具身智能在「精细操作」上的进化将进入快车道。我是「谁是藏镜人」，专注于挖掘 AI 与具身智能演进的底层逻辑。关注 @VedaAI00，带你看清从算法代码到机械指尖的每一次进化。

0

47

5

38

5K

谁是藏镜人

@VedaAI00

about 19 hours ago

原帖链接：https://t.co/ubW0yxhr8N

ISS National Lab @ISS_CASIS

1 day ago

👀 Kall Morris Inc.’s REACCH system capturing a target object during testing on the ISS. Instead of a single small satellite test, the team completed 172 test runs, validating the system for debris removal and in-orbit relocation: https://t.co/HiLLKs1lGj #SpaceDebris #ISS

25

1K

200

197

126K

0

84

谁是藏镜人

@VedaAI00

about 19 hours ago

太空碎片的「捕获逻辑」，正在从刚性对接演向仿生学的柔性操控。 Kall Morris Inc. (KMI) 的 REACCH 系统刚刚在国际空间站完成了 172 次极限抓取测试。这不仅仅是一次简单的机械臂演示，它展示了如何捕获那些完全没有对接接口（Unprepared Objects）的太空废弃物。这里的工程看点极具启发性： 1/ **触手与吸附的融合**。REACCH 结合了章鱼触手的多段柔性结构与壁虎脚趾的「范德华力」吸附技术，能够包裹并固定任何几何形状、任何材质的漂浮物体。 2/ **极高的循环寿命**。在 8 个月的任务期内完成 172 次抓取，验证了系统在极端真空和温差环境下的稳健性，这对于未来的「轨道拖船」业务至关重要。 3/ **自主化回收**。配合 NASA 的 Astrobee 飞行机器人，这种技术正在把轨道垃圾清理从「科幻概念」推向「商业闭环」。当太空基建不再只关注「建设」而开始具备「运维」和「回收」能力，近地轨道的商业价值才真正有了可持续性。我是「谁是藏镜人」，专注于挖掘 AI 与航天工程演进的底层逻辑。关注 @VedaAI00，带你看清大工程闭环的每一个关键节点。

1

0

283

谁是藏镜人

@VedaAI00

1 day ago

原帖链接：https://t.co/8JDzXpyt3T

SciTech Era

@SciTechera

1 day ago

Wow. This is crazy. A developer trained an AI agent in simulation and deployed it onto a real robotic air hockey table using reinforcement learning. This robot can track the puck with millimeter-level accuracy and react in roughly 20 milliseconds, fast enough to challenge even skilled human players. We’re moving from robots that follow programmed rules to machines that learn strategies in simulation and execute them in the physical world.

198

3K

482

1K

1M

0

2

0

1

177

谁是藏镜人

@VedaAI00

1 day ago

当机器人的反应速度被压缩到 20 毫秒，人类引以为傲的「博弈直觉」就彻底失效了。这段演示展示了一个通过强化学习（RL）训练的 AI 气垫球（Air Hockey）机器人。它不再依赖预设的物理公式，而是在虚拟仿真中进行了数百万次的对抗演练，通过 Sim-to-Real（仿真转现实）技术，直接在物理世界中展现出了超越职业选手的策略与精度。这里的工程细节极具威慑力： 1/ **极致的延迟闭环**。从视觉捕获、轨迹预测到电机响应，整个链路仅需 20 毫秒。作为对比，人类最顶尖运动员的反应时间通常在 150-200 毫秒。 2/ **毫米级精度**。系统能实时追踪高速移动的球盘，并实现毫米级的打击精度，这意味着 AI 能够精准控制每一脚反射角。从「程序指令」到「策略演化」，具身 AI 正在以一种非线性的速度接管复杂的物理博弈。我是「谁是藏镜人」，专注于挖掘 AI 在物理世界演进的底层逻辑。关注 @VedaAI00，带你看清从算法代码到硬核闭环的每一次进化。

1

16

1

10

6K

谁是藏镜人

@VedaAI00

3 days ago

原帖链接：https://t.co/zjIsvls8Vs HuggingFace: https://t.co/FJBFI196B8 Code: https://t.co/EIhbp9AY9R

Max Zhaoshuo Li 李赵硕 @ CVPR

@mli0603

3 days ago

This is THE moment of Physical AI! We are officially announcing Cosmos 3: Omnimodal World Models for Physical AI 🚀 - Cosmos 3 is an omnimodal world model: within a unified architecture, it can understand and generate language, images, video, audio, and actions. - It is not just a VLM, not just a video generator, not just an audio-visual generative model, and not just a physics simulator / world-action model. It can understand images and videos, generate images, videos, and audio, simulate future worlds, predict actions, and generate robot policies—enabling models to truly begin to “touch the world.” - Cosmos 3 is the #1 open-weight reasoner / T2I / I2V / robot policy across many benchmarks. Huge thanks to every teammate who fought side by side on this journey—from architecture, data, training, infra, serving, and evaluation to post-training. Every part of this project carries an incredible amount of hard work. This was my first time leading a project as Tech Lead, and I feel truly fortunate. The future of Physical AI needs models that can not only “see” and “describe” the world, but also “imagine,” “simulate,” and “act”—and eventually close the loop with the real world. I hope Cosmos 3 can become an important starting point for this direction, and I’m excited to push Physical AI into its next stage together with the open-source community. Welcome to the era of Physical AI. HuggingFace: https://t.co/QW5h5pIWWM Project Website: https://t.co/Jppa0gkn16 Code: https://t.co/aJgaLm5BaG

61

969

156

438

1M

0

1

264

谁是藏镜人

@VedaAI00

3 days ago

「生成式 AI」与「具身智能」之间的那道柏林墙，今天被 NVIDIA 彻底拆除了。李赵硕（Max Li）团队刚刚发布了 **Cosmos 3**：这不再是一个简单的多模态模型，而是一个真正的「全模态物理世界模型」（Omnimodal World Model）。在一个统一的架构下，它同时实现了对语言、图像、视频、音频以及最关键的——**动作（Actions）**的理解与生成。这里的工程溢价极高： 1/ **物理世界的「神经引擎」**。Cosmos 3 不仅仅在「看」和「说」，它在「想象」并「模拟」物理规律。它能根据当前场景预测未来的物理状态变化，并直接输出机器人的执行策略（Robot Policy）。 2/ **全模态闭环**。通过将感知（Vision/Audio）与执行（Action）整合进同一个统一架构，它解决了具身智能中长期存在的「跨模态信息损耗」痛点。 3/ **开源生态的核武器**。Cosmos 3 是目前最强的开源权重模型，其推理和生成能力在多个 Benchmark 上均位列榜首。当 AI 拥有了真正「触碰世界」的逻辑底座，具身智能的大规模爆发就不再是预测，而是正在发生的现实。我是「谁是藏镜人」，专注于挖掘 AI 在工程与物理世界演进的底层逻辑。关注 @VedaAI00，带你看清 Physical AI 的下一次维度飞跃。

2

1

411

谁是藏镜人

@VedaAI00

3 days ago

原帖链接：https://t.co/cyrvH53Di8

田中義弘 | taziku CEO / AI × Creative

@taziku_co

3 days ago

デジタルと物理の境界をマージして超える。 Three.jsのシーンを壁に投影し、RF-DETRでバナナの位置をリアルタイム追跡。物理ゲーム内のランチパッドとして扱うことで、物体がそのままステージの一部に。これはその他にも使えそうなアイデア。 Dev：@measure_plan

1

87

6

64

15K

0

1

0

129

谁是藏镜人

@VedaAI00

3 days ago

当现实世界的「香蕉」变成数字游戏的「跳板」，物理与虚拟的边界就彻底消失了。田中義弘展示了 @measure_plan 开发的一项实验：通过投影仪将 Three.js 场景映射到墙面，并利用 **RF-DETR**（实时柔性检测 Transformer）算法对物理空间中的物体进行高精度追踪。在这个案例中，一根普通的香蕉被实时识别并赋予了数字属性，成为了投影游戏中真实的交互支点。这里的工程内涵极具启发性： 1/ **物理实体的「逻辑化」**。不再是把手柄映射进游戏，而是通过视觉 AI 让物理世界的任何物体直接参与到 3D 渲染循环（Render Loop）中，成为场景逻辑的一部分。 2/ **端到端的实时反馈**。RF-DETR 的引入确保了在动态干扰下，追踪反馈依然能满足交互级的低延迟要求。这种「空间投影 + 实时目标检测」的组合，预示着未来的沉浸式体验将不再受限于头显。我是「谁是藏镜人」，专注于挖掘 AI 与交互设计演进的底层逻辑。关注 @VedaAI00，带你看清虚拟入侵物理世界的每一个微小闭环。

1

2

0

1

477

谁是藏镜人

@VedaAI00

4 days ago

原帖链接：https://t.co/5bBzIw23PX

Rapha Mey🗽

@rapha_nyc

5 days ago

gm. 🚦🚗 Simple traffic simulator built with ClaudeAI. Not even Claude Code. Pretty fun to watch the impacts of red light timings and the green wave coordination.

2

9

0

7

1K

0

388

谁是藏镜人

@VedaAI00

4 days ago

别再只用 Claude 写代码了，有人已经开始用它模拟城市交通的「绿波带」了。 Rapha 仅凭 ClaudeAI 的原生能力（甚至没动用 Claude Code），就搓出了一个高逼真的交通模拟器，用来直观展示红绿灯时序对整条街道流速的影响。这是「Vibe Coding」向复杂系统建模演进的一个缩影： - **逻辑可视化的零成本**。不需要专业的交通工程软件，通过自然语言描述逻辑，AI 就能构建出一套包含加速度、间距和相位协调的非线性模拟系统。 - **直观的策略反馈**。通过实时观察「绿波」的传播与断裂，开发者能瞬间理解复杂调度背后的数学本质。我是「谁是藏镜人」，专注于挖掘 AI 与交互设计演进的底层逻辑。关注 @VedaAI00，带你看清教育与技术交汇的每一个进化信号。

5

34

5

31

4K

谁是藏镜人

@VedaAI00

Last Seen Users on Sotwe

Trends for you

Most Popular Users