اشتراک ۲۰۰ دلاری ChatGPT Pro گرونه؟ برا OpenAI که باخت خالصه!
طبق آمار SemiAnalysis، هز��نه پردازش یه کاربر پرمصرف (برنامهنویسی سنگین) میتونه تا ۱۴,۰۰۰$ برای OpenAI آب بخوره! کافیه فقط ۵.۷٪ از ظرفیت تئوریک اکانتت رو استفاده کنی تا شرکت وارد فاز ضرردهی بشه.
مدل GLM-5.2 از https://t.co/8uLKDhxRkr هم منتشر شد؛ یک MoE متنباز با تمرکز بر کدنویسی و استدلال بلندمدت. این خانواده اکنون با 744B پارامتر (40B فعال) و بهبودهای پسآموزش مبتنی بر RL، به یکی از جدیترین رقبای مدلهای Frontier در تسکهای کدنویسی و استفاده از ابزارها تبدیل شده است.
تقطیر (Distillation) در LLMها یعنی آموزش یک مدل روی خروجیهای مدل دیگر. امروز بسیاری از مدلهای چینی با پاسخهای Claude، GPT فاینتیون میشوند تا الگوهای استدلال، کدنویسی و ترجیحات آنها را جذب کنند. این موضوع یکی از نگرانی های شرکتهای بزرگ آمریکایی است.
@un_arrow بهینهسازی سختافزاری همان چیزی است که در نسلهای جدید GPU میبینیم؛ مسیری مؤثر اما بسیار پرهزینه. در سمت نرمافزار نیز بهینهسازی از طریق کوانتیزهکردن مدلها و کاهش دقت محاسبات انجام میشود، اما این کار معمولاً با افت کیفیت خروجی همراه است و به نارضایتی کاربران منجر میشود.
وقتی یک 4090 در پیک ۴۰۰ وات برق میکشد، تصور مصرف انرژی دیتاسنترهای AI سرگیجهآور است. با ۱ میلیارد کاربر فعال ماهانه، OpenAI هنوز زیانده است. شاید سؤال اصلی آینده AI این باشد که چه کسی هزینه برق و سختافزار این هوشمندی را پرداخت میکند. اشتراک ۲۰ دلاری شاید بزودی خاطره شود.
چند روزی از انتشار Kimi-K2.7-Code میگذرد. سازندگان میگویند این مدل با یک تریلیون پارامتر برای تسکهای طولانی کدنویسی بهینه شده، کانتکست 256K دارد و نسبت به K2.6 حدود ۳۰٪ توکن کمتری برای استدلال مصرف می��ند. با این حال، بنچمارکها هنوز فاصله زیادی با مدلهای روز نشان میدهند.
@vahidrezazadeh5 قدیمها که یکبار مصرف بود فکر نکنم عوض کرده باشه. زودتر هم تسویه کنی سودش رو برنمیگردونه. یبار حساب کردم تقریبا هر وام ۵۵٪ سود بانکیش میوفته برات
به طور رسمی Ollama اعلام کرد که از اجینت Cline CLI پشتیبانی میکند. Cline و نسخه فورکش Kilo code هر دو از ایجنت کدهای سبک و سریع vscode هستند و علاوه بر مدلهای تجاری، پشتیبانی مناسبی از مدلهای چینی و اوپن سورس دارند.
بهترین مدل لوکال هوش مصنوعی برای کدنویسی با حداقل سخت افزار در حال حاضر، Qwen3. 6:27b است. در رتبه دوم Qwen3. 6:35b قرار دارد. این مدلها حداقل ۲۴ گیگابایت رم کارت گرافیک لازم دارند و در غیر این صورت، سرعت به طور قابل توجهی کاهش مییابد.
@noghtezannn قبلا شرکتها روی جونیور سرمایه گذاری میکردند تا سینیور بشه و بعدا از تخصصش استفاده کنند. ولی خب الان با AI این هزینه اضافی هست و بازدهی نداره
@Valhallahilll برای فرانت نیازی به درک کل سیستم نداری و فقط کافیه همون قسمت طراحی رو متوجه بشی و مدلهای فعلی تو این زمینه خیلی پیشرفت کردند و عملا یک بکند کار کافیه و نیازی به هزینه اضافه نیست.
در عصر AI دو پیشبینی متضاد مطرح است: داریو آمودی میگوید دوران برنامهنویسی انسانها رو به پایان است؛ جنسون هوانگ معتقد است AI تقاضا برای برنامهنویسان را بیشتر خواهد کرد. فعلاً هیچکس پاسخ قطعی ندارد؛ باید صبر کرد و دید کدام پیشبینی به واقعیت نزدیکتر میشود.
اگر برای شما سوال است که چرا مدل ۳۵ با تعداد پارامتر بیشتر عملکرد ضعیفتری دارد، باید بگم که این مدل دارای معماری MOE است و تنها ۳ میلیارد پارامتر فعال دارد. سرعت تولید توکن آن تا ۲ برابر بیشتر از مدل دنس است، اما دقت پایینتری دارد. حداکثر کانتکس هر دو مدل ۲۵۶ کیلوبایت است.
بهترین مدل لوکال هوش مصنوعی برای کدنویسی با حداقل سخت افزار در حال حاضر، Qwen3. 6:27b است. در رتبه دوم Qwen3. 6:35b قرار دارد. این مدلها حداقل ۲۴ گیگابایت رم کارت گرافیک لازم دارند و در غیر این صورت، سرعت به طور قابل توجهی کاهش مییابد.
سایت https://t.co/Uzqgbejtk3 مکانی است که مدلهای سفارشی هوش مصنوعی برای دانلود ارائه میشود. بسیاری از مدلها جیلبریک شدهاند و محدودیتهای اخلاقی در آنها حذف گردیده است.
@Habeangorishere خریدن اشتراک کدکس یا کلاد مستقیم به نظرم اشتباه هست. بهترین کار رفتن سمت اشتراکهای غیر مستقیم مثل کرسر و ویندسرف و ... هست. ۹۰٪ تسک ها با مدلهای ارزون همون خروجی رو میده. اینها معمولا مدل��ای خیلی ارزون مثل کمپوزر یا swe دارند که کارتو راه میندازه و لیمیت نمیخوری مداوم