えーちゃん @nabe_189 - Twitter Profile

nabe_189 retweeted

8 days ago

ちょうど今、日本からNYCに来ている起業家が多かったのと、そろそろ自分がまた引っ越すかもなので、SFとNYCを比較したNoteを書きましたアメリカで起業するなら、SF? NYC? 両都市でスタートアップをやって感じたこと｜Nao Yukawa @NaoYukawa https://t.co/RUbp1PeVlQ

0

113

18

51

52K

えーちゃん @nabe_189

7 days ago

A・RA・SHIの冒頭の歌い出しって「Take it so, so. Take it so, so」って歌ってるんだずっと「時期尚早」だと思ってた

0

1

0

100

えーちゃん @nabe_189

30 days ago

五月祭中止で倒れるチルノ #五月祭

13

12K

799

401

207K

えーちゃん @nabe_189

about 1 month ago

GO批判してる人ってなんなんだろう、実際享受できるサービスは別にライドシェアと同等なわけだし、変にUberが覇権握って外貨流出しないだけ全然マシなように見えるんだけど

0

1

615

Who to follow

ebiyu

@ebiyu_

東大D2 / @ShunkeiJP 低遅延映像 / ‘23未踏アド / コトバーテル -オンライン- / @pororocca_web

亀こー。

@QGRWuB1zcxoTgJh

skg55→uts1→マテ工・TMI卒/ KFMF18のEVEだった / Ttime! / UTCT / 100Program2期 / SFP14 / 未踏Adv.2023年度採択

nabe_189 retweeted

about 1 month ago

I just released a revised version of my paper on Multiscreen, an alternative to Transformer for long-context language modeling. ✅ Maintains performance and retrieves information accurately on contexts far longer than those seen during training ✅ Much more stable at large learning rates — it can even train with learning rate 1 ✅ Smaller model size & faster inference ✅ More interpretable context selection I added more figures to the main text and rewrote the paper to make it easier to follow. I’d be very happy if you read it! Paper → https://t.co/fi9Ucl6oOy

mithernet's tweet photo. I just released a revised version of my paper on Multiscreen, an alternative to Transformer for long-context language modeling.

✅ Maintains performance and retrieves information accurately on contexts far longer than those seen during training
✅ Much more stable at large learning rates — it can even train with learning rate 1
✅ Smaller model size & faster inference
✅ More interpretable context selection

I added more figures to the main text and rewrote the paper to make it easier to follow. I’d be very happy if you read it!

Paper → https://t.co/fi9Ucl6oOy

8

161

27

130

30K

えーちゃん @nabe_189

about 1 month ago

自動運転導入による事故リスクより、高齢者ドライバーの事故リスクの方が高いと思うんだけど、こんな高齢化社会の日本で前者をとらない理由ってなんなの？

0

1

0

506

えーちゃん @nabe_189

about 2 months ago

JREC-IN Portal : 「スワヒリ語」担当非常勤講師の募集について https://t.co/tSzmKd0XyC スワヒリ語教えてる高校、気になりすぎる

0

1

0

232

えーちゃん @nabe_189

2 months ago

全然cmux+cliよりcodexのネイティブアプリの方が開発体験いい

0

2

0

219

nabe_189 retweeted

みぃ🍵 @mithernet

2 months ago

著者です！ Attentionの「相対比較しかできない」という制約を外した、新しい機構を提案しました ①まずわかりやすい利点 ✅学習時より圧倒的に長い文でも性能維持＆正確な情報取得 ✅収束が非常に高速（LR=1でも学習可能） ✅モデルサイズ4割削減 ✅推論速度3倍超 (続く) https://t.co/75rZpnqieu