KHÔNG ĐỢI NỮA, KHÔNG THỂ ĐỢI ĐƯỢC NỮA 😁
Sau 7749 lượt vote từ anh em trong cộng đồng, tụi mình quyết định sẽ tổ chức buổi workshop đầu tiên với chủ đề AI video production workflow 🎞️
- Idea thì có
- Tool thì cũng không thiếu
- AI thì hỏi gì cũng ra
Nhưng làm AI video nó chua lắm, bấm một phát là bay 5 đô 10 đô như chơi, chưa kể để biến một brief thô thành một sản phẩm bán được, kéo được view lại là một level hoàn toàn khác.
Nên buổi này Nghiên AI @nghienaivn sẽ mời những người trong nghề chất lượng, có kinh nghiệm thực chiến chia sẻ lại cho anh em tất tần tật từ:
-> brief thô & concept
-> script skeleton & storyboard
-> production checklist
để sau buổi đó mọi người sẽ có một plan video đủ rõ để bắt đầu làm tiếp.
- Thời gian: 9:00-11:30 -Thứ 7 - 13/06 (tuần sau)
- Check-in từ 8:30
- Đăng ký giữ chỗ: https://t.co/UTbmMI7m1b (Số lượng chỗ ngồi có giới hạn, anh em đi được thì giữ chỗ cho tụi mình biết nha)
- Địa điểm: Tụi mình sẽ gửi qua mail sau
Mình nghĩ buổi này sẽ hợp với creator, marketer, founder/SME, content team, hoặc ai đang muốn làm video bài bản hơn nhưng chưa có workflow rõ. Nếu thấy hợp thì ghé cùng tụi mình nha.
Nếu mn có thêm thắc mắc gì hay bất kỳ nhu cầu nào về buổi hôm đó, comment giúp mình 1 dòng: bạn đang làm video kiểu gì / đang muốn làm video cho việc gì để bọn mình sắp xếp chỉnh sửa nội dung cho phù hợp với nhu cầu của anh em nha.
[ĐỈNH CHÓP] 80% code tại Anthropic hiện do Claude viết. Tức là Claude cũ sẽ tạo ra Claude mới tiếp theo 👀
Nếu nhìn vào 4 biểu đồ họ công bố, có thể thấy ngành AI đang tiến gần hơn bao giờ hết tới một vòng lặp mà AI tham gia trực tiếp vào quá trình tạo ra AI mới.
Bức ảnh đầu tiên mô tả sự thay đổi trong cách Anthropic phát triển Claude từ năm 2021 đến nay.
- Giai đoạn 2021-2023 khá đơn giản: con người ngồi trước máy tính, viết code và huấn luyện model.
- Đến giai đoạn 2023-2025, chatbot bắt đầu tham gia hỗ trợ viết các đoạn code ngắn.
- Sang năm 2025-2026, coding agent xuất hiện và có thể tự chỉnh sửa file, tự thực hiện tác vụ kỹ thuật.
Hiện tại @AnthropicAI đã chuyển sang mô hình "autonomous agents", nơi Claude có thể tự chạy code, tự thực hiện công việc kéo dài hàng giờ và giao việc cho nhiều agent khác.
Bước cuối cùng mà Anthropic mô tả là "Closing the Loop" - khi AI đủ khả năng tham gia trực tiếp vào việc nghiên cứu, huấn luyện và cải thiện thế hệ AI tiếp theo.
Trung Quốc đang hút nhân tài AI từ Mỹ về nước
Nhân vật tiêu biểu là Yao Shunyu, cựu nhà nghiên cứu của OpenAI, hiện đã trở thành Giám đốc Khoa học AI của Tencent để phát triển AGI.
Ngoài ông này còn có:
- Hao Zhou từ Google DeepMind để hỗ trợ phát triển Qwen (Alibaba)
- Wu Yonghui, cựu Phó Chủ tịch Nghiên cứu tại Google DeepMind, về lãnh đạo mảng nghiên cứu AI của ByteDance
- Moonshot AI (Kimi) được thành lập bởi Yang Zhilin, người từng làm việc tại Meta AI và Google Brain.
Điều này phản ánh một sự thay đổi khá lớn. Trong nhiều năm, các công ty Mỹ như OpenAI, Anthropic hay Google DeepMind tập trung vào mục tiêu AGI, trong khi các công ty Trung Quốc chủ yếu ưu tiên ứng dụng AI vào sản xuất, điện tử tiêu dùng và các sản phẩm thực tế.
Nhưng bây giờ cùng với những nhân tài này, Trung Quốc có thể đi nhanh hơn trong cuộc đua AGI. Và quan trọng hơn với anh em chúng ta là giá mặt bằng của AI sẽ bình ổn hơn 😁
Và thực tế là Trung Quốc đang có số lượng công ty trong lĩnh vực này không thua kém Mỹ.
- Trong khi Mỹ có 5 đại diện lớn là OpenAI (GPT), Anthropic (Claude), Google (Gemini), NVIDIA, Meta
- Thì Trung Quốc 7 đại diện lớn là Qwen (Alibaba), Kimi (Moonshot), MiniMax, DeepSeek, GLM (Zai), Mimo (Xiaomi), Byteplus,... (Còn chưa tính Tencent, StepFun cũng tham gia nhưng nhỏ hơn)
Không có Chính phủ tài trợ chắc không dám chơi kiểu này 🇨🇳
Trong khi mấy công ty công ty AI khác đang cắt giảm usage, thông báo lên giá,... thì ông @deepseek_ai thông báo mức giảm 75% của chương trình khuyến mãi trước đây sẽ trở thành giá cố định lâu dài luôn.
Con DeepSeek V4 Pro được đánh giá ngang Claude Sonnet 4.6, GPT 5.4, GPT 5.5 (low), GLM 5.1,... nhưng giá thì bá đạo luôn.
Để so sánh cho anh em dễ hình dung thì:
- Gemini 3.5 Flash thì Input $1.50 - Output $9 (Hàng Mỹ nên giá cao :))))
- GLM 5.1 model Trung Quốc Input $0.98 - Ouput $3.08 là đã rẻ rồi
Vậy mà DeepSeek V4 Pro chỉ có $0.435 Input - $0.87 Output, giả hơn 1 nửa!
Kiểu này mấy công ty AI từ Trung Quốc như Xiaomi (MiMo), Alibaba (Qwen),... còn mệt với DeepSeek chứ đừng nói tới Anthropic hay OpenAI.
Biết là độ thông minh của mấy ông Trung vẫn còn kém xa model Mỹ, nhưng việc thu hút người dùng sử dụng là cách không thể tạo tốt hơn để dùng data đó train ngược lại cho model của mình.
Sự thật là hầu hết thông tin, kiến thức trên mạng thì các AI model đã digest (tiêu hoá) hết rồi. Nên bây giờ ông nào build được lớp harness ngon hơn thì ông đó sẽ win.
Vibecode đã vô tình giết chết những bước cực kỳ quan trọng này
1. Suy nghĩ kỹ trước khi bắt tay vào xây dựng sản phẩm.
2. Nói chuyện với người dùng trước khi viết dòng code đầu tiên.
3. Tạo danh sách chờ (waitlist) để kiểm tra nhu cầu thị trường.
4. Phân tích và phân khúc khách hàng mục tiêu.
5. Mọi hình thức xác thực ý tưởng trước khi xây dựng.
6. Nghiên cứu đối thủ cạnh tranh.
7. Ưu tiên tính năng trước khi bắt đầu code (hay prompt cho AI code).
8. Xây dựng sản phẩm dựa trên vòng lặp phản hồi từ người dùng.
9. Vibe coding chỉ làm cho chi phí xây dựng một sản phẩm giảm mạnh đến mức nhiều người bỏ qua các bước này và nhảy thẳng vào giai đoạn tạo sản phẩm.
Nhưng cuối cùng, thứ quyết định sản phẩm có thành công hay không vẫn là người dùng, thị trường và khả năng giải quyết một vấn đề thật sự tồn tại.
AI giúp bạn xây nhanh hơn, nhưng không giúp bạn tránh được việc hiểu khách hàng.
Biểu đồ cuối cùng mới là thứ khiến nhiều researcher chú ý. Anthropic lấy 129 phiên nghiên cứu thực tế của đội ngũ Claude Code và tìm những thời điểm mà researcher có thể đã đưa ra quyết định chưa tối ưu. Sau đó họ yêu cầu các model Claude đề xuất hướng đi thay thế.
Kết quả cho thấy Claude Haiku 3 vào tháng 3/2024 chỉ đưa ra lựa chọn tốt hơn researcher trong 22% trường hợp.
Đến Claude Sonnet 4 là 48%, Sonnet 4.5 là 50%, Opus 4.5 là 51%, Opus 4.6 là 55%, Opus 4.7 là 59% và Mythos Preview đạt tới 64%.
Nếu cộng thêm các trường hợp hòa nhau, Mythos đạt khoảng 73% số phiên mà lựa chọn của model bằng hoặc tốt hơn con người.
Follow @nghienaivn để cập nhật nhiều chia sẻ hữu ích về AI 👇
https://t.co/wOX7GsW3qv
[ĐỈNH CHÓP] 80% code tại Anthropic hiện do Claude viết. Tức là Claude cũ sẽ tạo ra Claude mới tiếp theo 👀
Nếu nhìn vào 4 biểu đồ họ công bố, có thể thấy ngành AI đang tiến gần hơn bao giờ hết tới một vòng lặp mà AI tham gia trực tiếp vào quá trình tạo ra AI mới.
Bức ảnh đầu tiên mô tả sự thay đổi trong cách Anthropic phát triển Claude từ năm 2021 đến nay.
- Giai đoạn 2021-2023 khá đơn giản: con người ngồi trước máy tính, viết code và huấn luyện model.
- Đến giai đoạn 2023-2025, chatbot bắt đầu tham gia hỗ trợ viết các đoạn code ngắn.
- Sang năm 2025-2026, coding agent xuất hiện và có thể tự chỉnh sửa file, tự thực hiện tác vụ kỹ thuật.
Hiện tại @AnthropicAI đã chuyển sang mô hình "autonomous agents", nơi Claude có thể tự chạy code, tự thực hiện công việc kéo dài hàng giờ và giao việc cho nhiều agent khác.
Bước cuối cùng mà Anthropic mô tả là "Closing the Loop" - khi AI đủ khả năng tham gia trực tiếp vào việc nghiên cứu, huấn luyện và cải thiện thế hệ AI tiếp theo.
Anthropic định giá gần 1000 tỷ đô khi chỉ mới thành lập chưa đến 5 năm
Nếu kéo ngược về giai đoạn đầu thì tốc độ tăng định giá của Anthropic còn đáng chú ý hơn, vì công ty gần như đi từ startup nghiên cứu nhỏ thành công ty gần 1 nghìn tỷ USD chỉ trong khoảng 5 năm.
Tháng 5/2021 — Series A
Huy động: 124 triệu USD
Định giá: khoảng 550 triệu USD
Dẫn đầu bởi Dustin Moskovitz (đồng sáng lập Facebook) và Jaan Tallinn (đồng sáng lập Skype).
Đây là thời điểm Anthropic mới thành lập sau khi nhóm sáng lập rời OpenAI.
Tháng 4/2022 — Series B
Huy động: 580 triệu USD
Định giá: khoảng 4 tỷ USD
Dẫn đầu bởi Google và các quỹ lớn trong lĩnh vực AI.
Chỉ chưa đầy 1 năm sau Series A, định giá tăng từ khoảng 550 triệu USD lên 4 tỷ USD.
Tháng 5/2023 — Series C
Huy động: 450 triệu USD
Định giá: hơn 4 tỷ USD
Nhà đầu tư gồm Spark Capital, Google, Salesforce Ventures, Zoom Ventures và nhiều quỹ lớn khác.
Tổng vốn huy động của Anthropic lúc này đã vượt 1 tỷ USD.
Tháng 3/2025 — Series E
Huy động: 3.5 tỷ USD
Định giá: 61.5 tỷ USD
Tháng 9/2025 — Series F
Huy động: 13 tỷ USD
Định giá: 183 tỷ USD
Tháng 2/2026 — Series G
Huy động: 30 tỷ USD
Định giá: 380 tỷ USD
Tháng 5/2026 — Series H
Huy động: 65 tỷ USD
Định giá: 965 tỷ USD
Run-rate revenue vượt 47 tỷ USD/năm.
Nếu nhìn theo định giá:
2021: 550 triệu USD
2022: 4 tỷ USD
2023: hơn 4 tỷ USD
2025: 61.5 tỷ USD
2025 cuối năm: 183 tỷ USD
2026 đầu năm: 380 tỷ USD
2026 giữa năm: 965 tỷ USD
Từ Series E trở đi, quy mô vốn đã chuyển sang cấp độ hoàn toàn khác. Một vòng gọi vốn của Anthropic hiện lớn hơn GDP của nhiều quốc gia nhỏ.
Ngoài ra, Anthropic hiện vẫn đang đốt tiền ở quy mô cực lớn vì mỗi đô doanh thu kéo theo lượng compute khổng lồ phía sau. Chính bài viết của họ cũng dành phần lớn nội dung để nói về GPU, TPU, memory chip, cloud capacity và các thỏa thuận hạ tầng nhiều gigawatt.
Anthropic nói nhiều về doanh thu, nhưng chưa thấy nói về lợi nhuận 👀
Biểu đồ thứ ba đo tỷ lệ thành công của Claude Code theo độ khó công việc. Với các tác vụ đơn giản, tỷ lệ thành công hiện duy trì quanh mức 85-90%.
Với các tác vụ thông thường trong phát triển phần mềm, tỷ lệ thành công đã tăng từ khoảng 65% lên gần 90%. Nhưng phần gây chú ý nhất là nhóm bài toán mở (open-ended problems) - loại công việc gần giống nghiên cứu, thiết kế hệ thống hoặc giải quyết các vấn đề chưa có đáp án rõ ràng.
Vào cuối năm 2025, Claude chỉ đạt khoảng 10-20% thành công ở nhóm này. Đến giữa năm 2026, con số đã vượt 75%.
🔴 Viettel tham gia cuộc đua AI Model với 120 tỷ tham số
Chưa biết thực tế như thế nào nhưng 120 tỷ tham số sẽ ngang với mô hình:
- Open-source GPT-OSS-120B của @OpenAI
- Nemotron-3 Super của @nvidia (mô hình của Viettel được build trên mô hình này, gọi là VT-Super-120B-A12B)
- @MistralAI -Small-119B (ông này của Pháp)
- @Alibaba_Qwen 3.5-122B của Alibaba
Làm thế nào để máy tính hiểu bạn "vẽ" gì?
Ông thần David Finsterwalder đã vibe coding để tạo một công cụ trực quan hóa Neural Network cho sinh viên và quyết định open-source toàn bộ dự án.
https://t.co/OMIg785LSD
https://t.co/OWoqo7QYW1
Ứng dụng cho phép quan sát một mạng MLP đơn giản được huấn luyện trên bộ dữ liệu chữ số viết tay MNIST qua nhiều giai đoạn khác nhau. Bạn có thể nhìn thấy cách các neuron, trọng số và biểu diễn dữ liệu thay đổi trong quá trình model học thay vì chỉ xem những con số khô khan.
Phần trực quan hóa được xây dựng bằng Three.js, còn toàn bộ mã huấn luyện model được viết bằng PyTorch và đi kèm trong repo.
Google khoe Gemma4 12B (open-source model) có thể chạy trên laptop không thua kém cloud model
Ở tầng model là Gemma 4 12B.
Ở tầng runtime là LiteRT-LM.
Ở tầng ứng dụng là AI Edge Gallery và AI Edge Eloquent.
Khi ghép các lớp này lại với nhau, người dùng có thể tạo ra các workflow agentic chạy hoàn toàn trên thiết bị cá nhân.
Ví dụ, @googlegemma 4 12B có thể nhận dữ liệu từ file, tự viết code Python, thực thi code ngay trên máy, tạo biểu đồ và phân tích dữ liệu mà không cần gửi dữ liệu lên cloud.
@Google cũng giới thiệu Eloquent, một ứng dụng dictation và chỉnh sửa văn bản chạy hoàn toàn offline. Người dùng có thể đọc nội dung bằng giọng nói, yêu cầu AI tóm tắt, viết lại hoặc dịch văn bản mà không cần kết nối Internet.
Điểm đáng chú ý nhất là LiteRT-LM, Google bổ sung chế độ "serve", cho phép laptop trở thành một @OpenAI -compatible API server ngay trên máy cá nhân.
Điều đó có nghĩa là các công cụ như @openclaw , Hermes, Continue, Aider hay Open WebUI có thể kết nối trực tiếp tới Gemma 4 12B đang chạy local giống như đang gọi API của OpenAI.
Codex làm thế là không thương Lovable, Replit, Bold,... rồi 👀
Codex @OpenAI ra mắt Sites - Bây giờ anh em có thể biến một ý tưởng, báo cáo hay phân tích thành website hoặc ứng dụng tương tác có thể chia sẻ bằng URL cho cả team.
Thay vì tạo một file PowerPoint hoặc Google Docs, người dùng có thể yêu cầu Codex tạo dashboard, hub sản phẩm, workspace đánh giá khách hàng hay công cụ lập kế hoạch và liên tục cập nhật chúng theo thời gian.
Hiện tại mới chỉ có ở bản Business và Enterprise, còn chúng ta đợi thêm vài bữa nữa 😁
----
Tính ra @Lovable sở hữu một thứ cực kỳ mạnh là Harness layer của nó. Cùng 1 prompt nhưng Lovable có thể tạo web app hoàn chỉnh hơn nhiều so với Codex vì nó được tích hợp sẵn tất cả các skill từ backend đến frontend. Nên đây là lý do Lovable đắt xắt ra miếng.
Nhưng miếng bánh ngon thì ai cũng muốn có phần, thế là Codex cũng nhảy vào công bố tôi đã kết nối với 62 app và 110 skill cho anh em ở mọi ngành nghề như analyst, marketer, designer, researcher, investor, banker đều dùng được luôn.
Anh em không chú ý đến bước này của MAIcrosoft sao? 👀
Trong lúc mọi người đang bàn về MAI-Thinking hay MAI-Code, Microsoft lại âm thầm công bố thêm Project Solara.
Đây là nền tảng thiết bị được thiết kế để chạy AI Agent thay vì app, mà nó chạy trên Andriod chứ không phải Windows 😁
@Microsoft demo 2 thiết bị. Một cái đặt trên bàn có thể nhận diện khuôn mặt, nghe lệnh bằng giọng nói. Một cái là badge đeo trên ngực có camera và microphone để ghi lại cuộc họp, chuyển giọng nói thành văn bản và giúp agent hiểu những gì đang diễn ra ngoài đời thực.
Nghĩa là thay vì agent chỉ đọc email hay tài liệu, giờ nó có thể quan sát quy trình vận hành thực tế, ghi nhận tương tác với khách hàng và hiểu cách công việc diễn ra ngoài đời.
Con này giá bao nhiêu thì anh em mới chịu 'xì tiền' mua? 🤔
Codex làm thế là không thương Lovable, Replit, Bold,... rồi 👀
Codex @OpenAI ra mắt Sites - Bây giờ anh em có thể biến một ý tưởng, báo cáo hay phân tích thành website hoặc ứng dụng tương tác có thể chia sẻ bằng URL cho cả team.
Thay vì tạo một file PowerPoint hoặc Google Docs, người dùng có thể yêu cầu Codex tạo dashboard, hub sản phẩm, workspace đánh giá khách hàng hay công cụ lập kế hoạch và liên tục cập nhật chúng theo thời gian.
Hiện tại mới chỉ có ở bản Business và Enterprise, còn chúng ta đợi thêm vài bữa nữa 😁
----
Tính ra @Lovable sở hữu một thứ cực kỳ mạnh là Harness layer của nó. Cùng 1 prompt nhưng Lovable có thể tạo web app hoàn chỉnh hơn nhiều so với Codex vì nó được tích hợp sẵn tất cả các skill từ backend đến frontend. Nên đây là lý do Lovable đắt xắt ra miếng.
Nhưng miếng bánh ngon thì ai cũng muốn có phần, thế là Codex cũng nhảy vào công bố tôi đã kết nối với 62 app và 110 skill cho anh em ở mọi ngành nghề như analyst, marketer, designer, researcher, investor, banker đều dùng được luôn.
Codex làm thế là không thương Lovable, Replit, Bold,... rồi 👀
Codex @OpenAI ra mắt Sites - Bây giờ anh em có thể biến một ý tưởng, báo cáo hay phân tích thành website hoặc ứng dụng tương tác có thể chia sẻ bằng URL cho cả team.
Thay vì tạo một file PowerPoint hoặc Google Docs, người dùng có thể yêu cầu Codex tạo dashboard, hub sản phẩm, workspace đánh giá khách hàng hay công cụ lập kế hoạch và liên tục cập nhật chúng theo thời gian.
Hiện tại mới chỉ có ở bản Business và Enterprise, còn chúng ta đợi thêm vài bữa nữa 😁
----
Tính ra @Lovable sở hữu một thứ cực kỳ mạnh là Harness layer của nó. Cùng 1 prompt nhưng Lovable có thể tạo web app hoàn chỉnh hơn nhiều so với Codex vì nó được tích hợp sẵn tất cả các skill từ backend đến frontend. Nên đây là lý do Lovable đắt xắt ra miếng.
Nhưng miếng bánh ngon thì ai cũng muốn có phần, thế là Codex cũng nhảy vào công bố tôi đã kết nối với 62 app và 110 skill cho anh em ở mọi ngành nghề như analyst, marketer, designer, researcher, investor, banker đều dùng được luôn.
Bạn cấu trúc chat session trên Codex như thế nào?
Mình thì chia theo workflow tổng + project nhỏ, còn chia sẻ dưới đây là của ông Dan Shipper (CEO Every)
- Một vài thread "pulse" chạy mỗi sáng để kiểm tra trạng thái của những thứ quan trọng. Ví dụ như các chỉ số cần theo dõi, báo cáo tăng trưởng, cuộc họp toàn công ty hoặc bất kỳ tín hiệu nào cần cập nhật hằng ngày.
- Một thread "log" dùng để ghi lại toàn bộ hoạt động đang diễn ra. Với nhiều người, đây giống như nhật ký làm việc, nơi theo dõi mình đang nghiên cứu gì, đang viết gì và ý tưởng đang phát triển như thế nào qua từng ngày.
- Một thread "inbox" đóng vai trò hộp thư trung tâm. Hiện tại nó có thể tổng hợp email, nhưng về lâu dài sẽ là nơi tập trung những thông tin quan trọng nhất từ các thread khác.
- Một thread "router" đóng vai trò điều phối. Nó biết tất cả các thread còn lại đang làm gì và được kết nối với email để tự động phân loại, chuyển thông tin đến đúng nơi phù hợp.
Kiểu này một hệ thống làm việc gồm nhiều agent chuyên trách, mỗi agent phụ trách một dòng công việc riêng và có khả năng trao đổi thông tin với nhau như tính năng Dynamic Claude mới ra sáng nay 💪
Ôi cái ma trận bát quái gì đây!?
Không phải đâu, zoom kỹ lại thì đó là cách mô hình AI được xây dựng như GPT, Claude, DeepSeek,...
Đây là LLM Architecture Gallery - nơi tập hợp sơ đồ kiến trúc của hàng loạt LLM hiện đại vào cùng một chỗ. Thay vì phải lục từng paper, blog hay repo GitHub, giờ có thể so sánh trực tiếp cách các model sử dụng Attention, MoE, Mamba, Hybrid Architecture, KV Cache hay các kỹ thuật tối ưu khác chỉ trong vài phút.
https://t.co/CsagCClFuf
https://t.co/VITGWRdI5n
Quá xứng đáng quá kỳ công. Đây là website đáng bookmark nhất hôm nay 💯
Follow @nghienaivn để tám về AI cùng tụi mình 😁
https://t.co/wOX7GsW3qv
Làm thế nào để máy tính hiểu bạn "vẽ" gì?
Ông thần David Finsterwalder đã vibe coding để tạo một công cụ trực quan hóa Neural Network cho sinh viên và quyết định open-source toàn bộ dự án.
https://t.co/OMIg785LSD
https://t.co/OWoqo7QYW1
Ứng dụng cho phép quan sát một mạng MLP đơn giản được huấn luyện trên bộ dữ liệu chữ số viết tay MNIST qua nhiều giai đoạn khác nhau. Bạn có thể nhìn thấy cách các neuron, trọng số và biểu diễn dữ liệu thay đổi trong quá trình model học thay vì chỉ xem những con số khô khan.
Phần trực quan hóa được xây dựng bằng Three.js, còn toàn bộ mã huấn luyện model được viết bằng PyTorch và đi kèm trong repo.
Một phút tìm hiểu thêm 😁
Khi nhìn vào hình bên trái, con người lập tức nhận ra đó là số 3. Nhưng Neural Network không nhìn thấy số 3. Thứ nó nhìn thấy chỉ là 784 giá trị số tương ứng với 784 pixel trong ảnh 28×28. Đối với AI, không tồn tại khái niệm "số 3", "nét cong" hay "chữ viết tay". Tất cả chỉ là dữ liệu số.
Toàn bộ 784 giá trị này được đưa vào mạng MLP (Multi-Layer Perceptron), sau đó đi qua hàng trăm neuron và hơn 100.000 trọng số kết nối. Mỗi neuron thực hiện các phép nhân ma trận và cộng trọng số để tạo ra một biểu diễn mới của dữ liệu. Sau lớp đầu tiên, mạng không còn nhìn ảnh gốc nữa mà đang làm việc với các đặc trưng trung gian mà chính nó tự học được.
Không ai lập trình cho mạng biết thế nào là số 3. Trong quá trình huấn luyện trên hàng triệu ảnh MNIST, hệ thống liên tục dự đoán, so sánh với đáp án thật rồi sử dụng backpropagation để điều chỉnh trọng số. Sau hàng triệu lần lặp lại như vậy, một số neuron bắt đầu phản ứng mạnh với các đặc điểm nhất định như nét cong phía trên, nét cong phía dưới, khoảng trống ở giữa hay các cấu trúc hình học thường xuất hiện trong chữ số.
Khi tín hiệu đi qua các lớp tiếp theo, những đặc trưng đơn giản này được kết hợp thành các đặc trưng phức tạp hơn. Thay vì học trực tiếp số 3, mạng học một hệ thống phân cấp đặc trưng, từ pixel → nét vẽ → hình dạng → chữ số.
Đến lớp cuối cùng, mạng tạo ra 10 giá trị tương ứng với các chữ số từ 0 đến 9. Hàm Softmax sẽ chuyển các giá trị này thành xác suất. Trong ví dụ trên, mạng kết luận rằng xác suất đây là số 3 gần như 100%, trong khi xác suất thuộc các số còn lại gần bằng 0%.
Dù mạng trong hình chỉ có khoảng 109.000 tham số và đạt độ chính xác hơn 98% trên MNIST, nguyên lý hoạt động cốt lõi của nó vẫn giống với các mô hình AI hiện đại. Bên dưới GPT, Claude hay Gemini vẫn là các lớp Neural Network liên tục biến đổi dữ liệu thành những biểu diễn ngày càng trừu tượng hơn.
Follow @nghienaivn ✅ để thấy nhiều thứ thú vị hơn về AI
https://t.co/wOX7GsW3qv
Làm thế nào để máy tính hiểu bạn "vẽ" gì?
Ông thần David Finsterwalder đã vibe coding để tạo một công cụ trực quan hóa Neural Network cho sinh viên và quyết định open-source toàn bộ dự án.
https://t.co/OMIg785LSD
https://t.co/OWoqo7QYW1
Ứng dụng cho phép quan sát một mạng MLP đơn giản được huấn luyện trên bộ dữ liệu chữ số viết tay MNIST qua nhiều giai đoạn khác nhau. Bạn có thể nhìn thấy cách các neuron, trọng số và biểu diễn dữ liệu thay đổi trong quá trình model học thay vì chỉ xem những con số khô khan.
Phần trực quan hóa được xây dựng bằng Three.js, còn toàn bộ mã huấn luyện model được viết bằng PyTorch và đi kèm trong repo.
Các công ty đổ tiền vào AI đã có lãi chưa?
Phần lớn là chưa ngoại trừ ông NVIDIA.
Toàn ngành AI đã chi khoảng 1.400 tỷ USD nhưng mới tạo ra khoảng 613 tỷ USD doanh thu. Hầu hết các công ty lớn đều đang trong trạng thái đốt tiền để xây hạ tầng nhanh nhất có thể.
Amazon đã chi khoảng 313 tỷ USD nhưng mới thu về 22 tỷ USD doanh thu liên quan đến AI. Google chi 287 tỷ USD, thu về 25 tỷ USD. Microsoft chi 266 tỷ USD, thu về 31 tỷ USD.
Đau nhất là Meta chi 230 tỷ USD nhưng doanh thu AI trực tiếp vẫn còn khá nhỏ, mấy năm trước còn bị dính chưởng với vụ Meta thực tế ảo.
Nhưng có một ngoại lệ là NVIDIA. Trong khi gần như cả ngành đang âm hàng chục tỷ USD, NVIDIA đã tạo ra khoảng 478 tỷ USD doanh thu từ AI với mức lợi nhuận tích lũy hơn 250 tỷ USD.
Xem ở đây nè: https://t.co/0aJHgxYEyo
Danh sách này còn thiếu nhiều ông từ Trung Quốc, có khi mấy ông này lại có lãi mới hay 😁
Các công ty đổ tiền vào AI đã có lãi chưa?
Phần lớn là chưa ngoại trừ ông NVIDIA.
Toàn ngành AI đã chi khoảng 1.400 tỷ USD nhưng mới tạo ra khoảng 613 tỷ USD doanh thu. Hầu hết các công ty lớn đều đang trong trạng thái đốt tiền để xây hạ tầng nhanh nhất có thể.
Amazon đã chi khoảng 313 tỷ USD nhưng mới thu về 22 tỷ USD doanh thu liên quan đến AI. Google chi 287 tỷ USD, thu về 25 tỷ USD. Microsoft chi 266 tỷ USD, thu về 31 tỷ USD.
Đau nhất là Meta chi 230 tỷ USD nhưng doanh thu AI trực tiếp vẫn còn khá nhỏ, mấy năm trước còn bị dính chưởng với vụ Meta thực tế ảo.
Nhưng có một ngoại lệ là NVIDIA. Trong khi gần như cả ngành đang âm hàng chục tỷ USD, NVIDIA đã tạo ra khoảng 478 tỷ USD doanh thu từ AI với mức lợi nhuận tích lũy hơn 250 tỷ USD.
Xem ở đây nè: https://t.co/0aJHgxYEyo
Danh sách này còn thiếu nhiều ông từ Trung Quốc, có khi mấy ông này lại có lãi mới hay 😁
Anthropic định giá gần 1000 tỷ đô khi chỉ mới thành lập chưa đến 5 năm
Nếu kéo ngược về giai đoạn đầu thì tốc độ tăng định giá của Anthropic còn đáng chú ý hơn, vì công ty gần như đi từ startup nghiên cứu nhỏ thành công ty gần 1 nghìn tỷ USD chỉ trong khoảng 5 năm.
Tháng 5/2021 — Series A
Huy động: 124 triệu USD
Định giá: khoảng 550 triệu USD
Dẫn đầu bởi Dustin Moskovitz (đồng sáng lập Facebook) và Jaan Tallinn (đồng sáng lập Skype).
Đây là thời điểm Anthropic mới thành lập sau khi nhóm sáng lập rời OpenAI.
Tháng 4/2022 — Series B
Huy động: 580 triệu USD
Định giá: khoảng 4 tỷ USD
Dẫn đầu bởi Google và các quỹ lớn trong lĩnh vực AI.
Chỉ chưa đầy 1 năm sau Series A, định giá tăng từ khoảng 550 triệu USD lên 4 tỷ USD.
Tháng 5/2023 — Series C
Huy động: 450 triệu USD
Định giá: hơn 4 tỷ USD
Nhà đầu tư gồm Spark Capital, Google, Salesforce Ventures, Zoom Ventures và nhiều quỹ lớn khác.
Tổng vốn huy động của Anthropic lúc này đã vượt 1 tỷ USD.
Tháng 3/2025 — Series E
Huy động: 3.5 tỷ USD
Định giá: 61.5 tỷ USD
Tháng 9/2025 — Series F
Huy động: 13 tỷ USD
Định giá: 183 tỷ USD
Tháng 2/2026 — Series G
Huy động: 30 tỷ USD
Định giá: 380 tỷ USD
Tháng 5/2026 — Series H
Huy động: 65 tỷ USD
Định giá: 965 tỷ USD
Run-rate revenue vượt 47 tỷ USD/năm.
Nếu nhìn theo định giá:
2021: 550 triệu USD
2022: 4 tỷ USD
2023: hơn 4 tỷ USD
2025: 61.5 tỷ USD
2025 cuối năm: 183 tỷ USD
2026 đầu năm: 380 tỷ USD
2026 giữa năm: 965 tỷ USD
Từ Series E trở đi, quy mô vốn đã chuyển sang cấp độ hoàn toàn khác. Một vòng gọi vốn của Anthropic hiện lớn hơn GDP của nhiều quốc gia nhỏ.
Ngoài ra, Anthropic hiện vẫn đang đốt tiền ở quy mô cực lớn vì mỗi đô doanh thu kéo theo lượng compute khổng lồ phía sau. Chính bài viết của họ cũng dành phần lớn nội dung để nói về GPU, TPU, memory chip, cloud capacity và các thỏa thuận hạ tầng nhiều gigawatt.
Anthropic nói nhiều về doanh thu, nhưng chưa thấy nói về lợi nhuận 👀
Về mức độ thông minh, Anthropic nhường spotlight cho Mythos, còn Opus tập trung vào...
Còn các model Opus, cạnh tranh trực tiếp với GPT 5.x hay Gemini 3.5 thì Anthropic sẽ cạnh tranh bằng tốc độ và chi phí.
Nên anh em thấy trong ảnh điểm số của Opus 4.8 chỉ tăng nhẹ so với 4.7 nhưng token hiệu quả hơn khoảng 61%, còn chế độ Fast Mode rẻ hơn gần 3 lần.
Không có Chính phủ tài trợ chắc không dám chơi kiểu này 🇨🇳
Trong khi mấy công ty công ty AI khác đang cắt giảm usage, thông báo lên giá,... thì ông @deepseek_ai thông báo mức giảm 75% của chương trình khuyến mãi trước đây sẽ trở thành giá cố định lâu dài luôn.
Con DeepSeek V4 Pro được đánh giá ngang Claude Sonnet 4.6, GPT 5.4, GPT 5.5 (low), GLM 5.1,... nhưng giá thì bá đạo luôn.
Để so sánh cho anh em dễ hình dung thì:
- Gemini 3.5 Flash thì Input $1.50 - Output $9 (Hàng Mỹ nên giá cao :))))
- GLM 5.1 model Trung Quốc Input $0.98 - Ouput $3.08 là đã rẻ rồi
Vậy mà DeepSeek V4 Pro chỉ có $0.435 Input - $0.87 Output, giả hơn 1 nửa!
Kiểu này mấy công ty AI từ Trung Quốc như Xiaomi (MiMo), Alibaba (Qwen),... còn mệt với DeepSeek chứ đừng nói tới Anthropic hay OpenAI.
Biết là độ thông minh của mấy ông Trung vẫn còn kém xa model Mỹ, nhưng việc thu hút người dùng sử dụng là cách không thể tạo tốt hơn để dùng data đó train ngược lại cho model của mình.
Sự thật là hầu hết thông tin, kiến thức trên mạng thì các AI model đã digest (tiêu hoá) hết rồi. Nên bây giờ ông nào build được lớp harness ngon hơn thì ông đó sẽ win.
Bạn cấu trúc chat session trên Codex như thế nào?
Mình thì chia theo workflow tổng + project nhỏ, còn chia sẻ dưới đây là của ông Dan Shipper (CEO Every)
- Một vài thread "pulse" chạy mỗi sáng để kiểm tra trạng thái của những thứ quan trọng. Ví dụ như các chỉ số cần theo dõi, báo cáo tăng trưởng, cuộc họp toàn công ty hoặc bất kỳ tín hiệu nào cần cập nhật hằng ngày.
- Một thread "log" dùng để ghi lại toàn bộ hoạt động đang diễn ra. Với nhiều người, đây giống như nhật ký làm việc, nơi theo dõi mình đang nghiên cứu gì, đang viết gì và ý tưởng đang phát triển như thế nào qua từng ngày.
- Một thread "inbox" đóng vai trò hộp thư trung tâm. Hiện tại nó có thể tổng hợp email, nhưng về lâu dài sẽ là nơi tập trung những thông tin quan trọng nhất từ các thread khác.
- Một thread "router" đóng vai trò điều phối. Nó biết tất cả các thread còn lại đang làm gì và được kết nối với email để tự động phân loại, chuyển thông tin đến đúng nơi phù hợp.
Kiểu này một hệ thống làm việc gồm nhiều agent chuyên trách, mỗi agent phụ trách một dòng công việc riêng và có khả năng trao đổi thông tin với nhau như tính năng Dynamic Claude mới ra sáng nay 💪
Anthropic định giá gần 1000 tỷ đô khi chỉ mới thành lập chưa đến 5 năm
Nếu kéo ngược về giai đoạn đầu thì tốc độ tăng định giá của Anthropic còn đáng chú ý hơn, vì công ty gần như đi từ startup nghiên cứu nhỏ thành công ty gần 1 nghìn tỷ USD chỉ trong khoảng 5 năm.
Tháng 5/2021 — Series A
Huy động: 124 triệu USD
Định giá: khoảng 550 triệu USD
Dẫn đầu bởi Dustin Moskovitz (đồng sáng lập Facebook) và Jaan Tallinn (đồng sáng lập Skype).
Đây là thời điểm Anthropic mới thành lập sau khi nhóm sáng lập rời OpenAI.
Tháng 4/2022 — Series B
Huy động: 580 triệu USD
Định giá: khoảng 4 tỷ USD
Dẫn đầu bởi Google và các quỹ lớn trong lĩnh vực AI.
Chỉ chưa đầy 1 năm sau Series A, định giá tăng từ khoảng 550 triệu USD lên 4 tỷ USD.
Tháng 5/2023 — Series C
Huy động: 450 triệu USD
Định giá: hơn 4 tỷ USD
Nhà đầu tư gồm Spark Capital, Google, Salesforce Ventures, Zoom Ventures và nhiều quỹ lớn khác.
Tổng vốn huy động của Anthropic lúc này đã vượt 1 tỷ USD.
Tháng 3/2025 — Series E
Huy động: 3.5 tỷ USD
Định giá: 61.5 tỷ USD
Tháng 9/2025 — Series F
Huy động: 13 tỷ USD
Định giá: 183 tỷ USD
Tháng 2/2026 — Series G
Huy động: 30 tỷ USD
Định giá: 380 tỷ USD
Tháng 5/2026 — Series H
Huy động: 65 tỷ USD
Định giá: 965 tỷ USD
Run-rate revenue vượt 47 tỷ USD/năm.
Nếu nhìn theo định giá:
2021: 550 triệu USD
2022: 4 tỷ USD
2023: hơn 4 tỷ USD
2025: 61.5 tỷ USD
2025 cuối năm: 183 tỷ USD
2026 đầu năm: 380 tỷ USD
2026 giữa năm: 965 tỷ USD
Từ Series E trở đi, quy mô vốn đã chuyển sang cấp độ hoàn toàn khác. Một vòng gọi vốn của Anthropic hiện lớn hơn GDP của nhiều quốc gia nhỏ.
Ngoài ra, Anthropic hiện vẫn đang đốt tiền ở quy mô cực lớn vì mỗi đô doanh thu kéo theo lượng compute khổng lồ phía sau. Chính bài viết của họ cũng dành phần lớn nội dung để nói về GPU, TPU, memory chip, cloud capacity và các thỏa thuận hạ tầng nhiều gigawatt.
Anthropic nói nhiều về doanh thu, nhưng chưa thấy nói về lợi nhuận 👀