Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
✌️
@etedjy
Joined February 2022
147
Following
140
Followers
34
Posts
etedjy
retweeted
みのるん
@minorun365
13 days ago
ありがとうございました!!今日の資料です🙌
#QiitaConference
Claude Codeですべての日常業務を爆速化しよう! https://t.co/8wEOQej6co
etedjy
retweeted
べっく
@bekku_zer
22 days ago
https://t.co/AVcQWWmVg0
etedjy
retweeted
farstep
@farstep_
23 days ago
https://t.co/QRfrinbolt
etedjy
retweeted
Daisuke Okanohara / 岡野原 大輔
@hillbig
28 days ago
LLMの事後学習では、オンポリシー蒸留(OPD)が有力な手法として使われている。OPDでは、生徒モデル自身が生成した出力に対して、より強い教師モデルのトークンごとの確率分布を参照し、生徒モデルを教師モデルに近づける。 しかしOPDには、学習中に強い教師モデルを常時サーブし続けなければならないという大きな問題がある。さらに、学習中の生徒モデルによるロールアウトも毎回行う必要がある。Lightning OPDは、この問題を解決する手法である。 まず、教師モデルが生成したデータでベースモデルをSFTし、参照モデルを作る。次に、この参照モデルを使って応答を一度だけ生成し、その応答に対する教師モデルのトークンごとの対数確率を事前計算して保存しておく。学習時には、参照モデルによる固定応答上で、保存済みの教師モデルの対数確率と、現在学習中の生徒モデルの対数確率との差をアドバンテージとして用い、生徒モデルを更新する。 従来、適当なモデルを使ってロールアウトデータを作ると、ロールアウト分布と、OPDで参照する教師が一致しない。本論文では、この不一致が勾配バイアスを生み、性能低下につながることを示している。これに対し、Lightning OPDではSFT教師とOPD教師を一致させることで、教師整合性を保つ。 実験では、4Bおよび8Bモデルの設定において、数学・コーディングタスクで標準OPDと同等、またはそれを上回る性能を達成している。また、計算コストについても、約4倍の効率化を実現している。 コメント === OPDは強力だが、実現にはかなり大きな計算・インフラ上の負担がある。Lightning OPDは、教師モデルの常時サービングと学習中の生徒ロールアウトを不要にすることで、OPDをかなり現実的に実行できる形にしている。 また、この手法におけるSFT段階は、広い意味でmid-trainingに近い役割を持っている。mid-trainingは、ベースモデルをいきなり最終タスクに向けて最適化するのではなく、目的に近い中間分布へ一度移動させる段階である。 Lightning OPDにおけるSFTも、後続のOPDが有効に働くように参照モデルの分布を整える段階であり、OPDのための分布整形とみなすことができる。
See More
Who to follow
Hideo RGV Gamma
@HideoRgvGamma
https://t.co/2AQSi71zZU ポートフォリオもあります。https://t.co/kFFPqyDXu2 です。もう一つはhttps://t.co/YugWGg5haAよろしくお願いします。CakePHP勉強中
いけがみ@BELTIES(ベルティーズ)運営
@exceed_ikegami
㈱メディアエクシード / BELTIES(ベルティーズ)運営 / EC事業部長 / Apple Watch(アップルウォッチ)バンド専門通販 / EC運営 / 商品開発 / OEM / 卸パートナー募集中 / Apple Watchアクセ市場を日々研究中
yagi
@t_yagit
Web Engineer (Front-ServerSide & Project Manager) | PrevJob SIer Infrastructure Engineer | 技術ネタ発信垢 | 時代はペーパーレス。再生紙なんか食べてたら腹壊すぞ。
etedjy
retweeted
Daisuke Okanohara / 岡野原 大輔
@hillbig
28 days ago
大規模言語モデルの学習では、Muonと呼ばれる最適化手法が注目されている。Muonは、通常の勾配降下とは異なり、各重み行列の勾配を行列として扱い、そのスペクトル構造を変換してから更新に使う。 Muonは勾配行列の方向ごとの強さを揃えるため、特異値を1に揃えてから適応する。そのためMuonの成功は、しばしば勾配スペクトルを白色化し、適切な非ユークリッド幾何に沿って最急降下しているからと説明されてきた。 今回の論文では、この説明に疑問を投げかけ、厳密な白色化や幾何構造ではなく、もっと粗いスペクトル操作とステップサイズの安定化ではないか、というのである。 例えば、Freonという変種を考え、通常の勾配降下から、Muon、さらに擬似逆行列に近いもので表せるものを作る。この場合、あるノルムに対する正しい最急降下として表せない範囲が最適なことがみられる。 さらに特異値をランダム化したKaonも実験ではMuonにかなり近い性能を示す。 これらの結果から、もしMuonの本質が特定のノルム幾何に厳密に従うことではなく、元の勾配スペクトルを破壊し、過大な特異値を抑え、更新スケールを安定化することにあるのではないかと示唆される。 さらに、バッチ勾配と真の勾配の整合性と、方向ごとの降下可能性をみた場合、通常の勾配方向は、一見すると最も自然に見えるが、ミニバッチ勾配にはノイズがあり、また曲率の高い方向に強く引っ張られることもある。その方向にそのまま進むと、ステップサイズを小さくせざるを得ない。 一方、MuonやFreon、Kaonのようなスペクトル変換は、勾配との単純な整合性を少し犠牲にするが、より低曲率で、大きなステップを踏みやすい方向を作る。 この観点では、Muonの本質は正しい幾何ではなく、学習率を合わせやすい更新方向を作っている可能性がある ただし、実験の中心はGPT-2規模やNanoGPT、WikiText-2であり、大規模事前学習で同じ結論が成り立つかは要検証
See More
etedjy
retweeted
コムテ
@commte
about 2 months ago
エンジニアの評価軸、AI 前提で書き換わってるという話。はてぶコメントにもあったけど「経験がある人」にしかできないやつな気がするなあ - AI 前提で仕事を設計する力 - PdM / 事業視点への越境 - 最終判断と品質への責任 - 個人技を組織の学習に変える力 https://t.co/WGv38cgBVC
etedjy
retweeted
LayerX Tech
@LayerX_tech
3 months ago
「Problemが少ないですが、本当にないんですか?」 バクラク事業部の須藤(
@sudoakiy
)が、現状に満足せず当たり前の水準を高め続ける組織文化と、信頼を前提としたフィードバックのリアルを綴りました📝 ぜひご覧ください! https://t.co/O7ZJjxAdwR
etedjy
retweeted
べっく
@bekku_zer
3 months ago
類似資料検索に gemini embedding 2 が使えそう、という記事を書きました。 今回はその続きで、gemini embedding 2 は資料の見た目の近さに引っ張られるのか、それとも内容の近さを見ていそうなのかを検証して、追加に記事としてまとめました。 https://t.co/B3wTyqkKqP
etedjy
retweeted
べっく
@bekku_zer
3 months ago
freee MCPのように操作の自動化が進むほど、 「資料に紐づくナレッジ」が重要な気がする。 gemini-embedding-2 で「類似資料とナレッジ」を検索できれば、過去にその資料をどう判断し、どう処理したかも再利用できて自動化しやすくなりそう。 というzenn記事を書きました。 https://t.co/9XhCIDKi9F
etedjy
retweeted
iwashi / Yoshimasa Iwase
@iwashi86
3 months ago
LLMのアーキテクチャギャラリー。よくまとまっている。 https://t.co/e3H8tYeG5u
etedjy
retweeted
O'Reilly Japan
@oreilly_japan
3 months ago
6月刊行予定の『ゼロから作るDeep Learning ❻ ―LLM編』ですが、モノクロだったカバーの動物🐟 Australian lungfish(オーストラリアハイギョ)に色がつき、ついにカバーがカラーになりました!徐々に近づく発売をどうぞお楽しみに! https://t.co/jQJ6KpcN13
✌️
@etedjy
3 months ago
高橋成美の顔も動きも可愛過ぎる
etedjy
retweeted
LayerX Tech
@LayerX_tech
4 months ago
先ほど発表しました、LayerX 澁井の登壇資料はこちらです! R&Dチームを起ち上げる https://t.co/uxetnzkrvO
#rnd_meetup
etedjy
retweeted
LayerX Tech
@LayerX_tech
5 months ago
LayerX バクラク事業部では、副業・業務委託エンジニアの方々も積極的に受け入れています! これまであまり知られていなかった受け入れ体制や、リモートでも安心して開発に参加いただける工夫について、ブログで詳しく紹介しています。 ぜひご覧ください👋 https://t.co/9TpG5u1PDn
etedjy
retweeted
べっく
@bekku_zer
5 months ago
「agent-browser」が実際にコンテキスト量をどのように減らしているのか?見つつ、実際にGeminiで動かしてみた内容の記事を公開しました。 「Playwright MCPよりも良い?「agent-browser」でGeminiにブラウザ操作させてみた」 https://t.co/nqdolVNW3a
✌️
@etedjy
5 months ago
徳島出身だけど、徳島県の人ってラインギリのこと言って笑いとってるつもりが、ライン超えてるパターン多い気がする。 あと、偏った持論で他人を評価してるイメージもある。
露木
@hTuyuki65536
5 months ago
徳島嫌われ四天王
etedjy
retweeted
いもいもくん
@ma_anago
6 months ago
https://t.co/KgBQdSuzyw やらかし系カレンダーでもトップになりそうな強力な話だわ。。やっぱAIは高い、、
✌️
@etedjy
almost 2 years ago
お盆は毎年何かしら勉強してるんだけど、 今年は強化学習!!! ゼロ作4とアイシアさんの動画がわかりやすすぎて、強化学習そのものが簡単なんじゃないかと思い始めてる…()
✌️
@etedjy
almost 2 years ago
よろしくお願いします!
#MIRU2024
✌️
@etedjy
almost 2 years ago
来週はMIRU参加する!!! 学生の顔して色々見に行きまーす!!! 今まで参加したことある国内学会は、 コロナで全部リモートだったから楽しみ😋 去年の国際学会は現地だったけど、 楽しむ余裕なんてなかった笑
Last Seen Users on Sotwe
Afghan
Seen from
Italy
😊
Seen from
Ireland
lara khalifa
Hijabi Channel ✨🌙
Franco
Seen from
Chile
Allelie
Seen from
Indonesia
KhanZ
Seen from
United Kingdom
🔞qwXXX.com
Seen from
Turkey
Her Türlü Video
Seen from
Turkey
Mineiro
Seen from
Brazil
Trends for you
1
Kimmel
Under 10K tweets
2
Jasmine Crockett
Under 10K tweets
3
ActBlue
Under 10K tweets
4
#CantAffordTrump
Under 10K tweets
5
Inflation
Under 10K tweets
6
Unionville
Under 10K tweets
7
$ORCL
Under 10K tweets
8
Patrick Mahomes
Under 10K tweets
9
Bridgit Mendler
Under 10K tweets
10
#SaveStargate
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.2M followers
2
Barack Obama
@barackobama
119.3M followers
3
Donald J. Trump
@realdonaldtrump
111.6M followers
4
Cristiano Ronaldo
@cristiano
109.2M followers
5
Narendra Modi
@narendramodi
106.9M followers
6
Rihanna
@rihanna
97.3M followers
7
NASA
@nasa
92.1M followers
8
Justin Bieber
@justinbieber
90.6M followers
9
KATY PERRY
@katyperry
87M followers
10
Taylor Swift
@taylorswift13
80.8M followers
11
Lady Gaga
@ladygaga
72.3M followers
12
Kim Kardashian
@kimkardashian
69.4M followers
13
Virat Kohli
@imvkohli
68.8M followers
14
YouTube
@youtube
68.6M followers
15
Bill Gates
@billgates
63.5M followers
16
The Ellen Show
@theellenshow
62.5M followers
17
CNN
@cnn
61.9M followers
18
Neymar Jr
@neymarjr
61.4M followers
19
X
@x
60.9M followers
20
Selena Gomez
@selenagomez
60.1M followers
Olivia
Online
✨
⭐
💫