Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
Suguru | データサイエンティスト
@st_data_science
データ分析・データ活用の専門家。英国王室公認統計家。東工大 (副総代)→ LSE (MSc Data Science)。ビッグデータラボ代表理事。ポストはあくまで一観点でのお気持ち表明で、客観的な妥当性を主張しません。
Joined December 2020
1K
Following
5.9K
Followers
2K
Posts
st_data_science
retweeted
Yuzo Maruyama
@umaruyama
3 days ago
preface(スキャン画像を閲覧可能)には,因果推論を重視すると書かれていますね。 「因果推論の基礎を説明せずに学生に回帰分析を学ばせるのは良くない。この点で,計量経済学者や疫学者は統計学者より優れている。なぜなら,彼らの入門書は,因果について丁寧に説明しているから。」
Suguru | データサイエンティスト
@st_data_science
5 days ago
業種って2パターンあって、「タイミングを売る人」と「成果を作る人」がいる。営業や管理職なんかは前者寄りで、士業やエンジニアなどは後者寄り。 後者は一定時間集中して開発や分析を提供しているから、電話などで遮られるのはとても苦手。前者は逆に、突発的な要求にいち早く対応する必要があり、そこに提供価値がある。 この2つの性質は本質的に両立しにくい。 どちらもできる人はいるけど、同時に実行するのはストレスが溜まるし効率も悪い。自分が今どの立場にいるか、どちらの性質の仕事に従事しているか考えると、そこに良い分業のヒントがあるように思う。
Suguru | データサイエンティスト
@st_data_science
8 days ago
ダッシュボードより目指すべきは、レコメンドシステム。データ可視化なんて言えば聞こえはいいけど、数が多ければただ認知負荷を与えるだけ。現状をただ見せて終わりでなく、データを踏まえて利用者により良い意思決定を提示できるのが理想。レコメンドの土俵は、実はECサイトや動画配信だけじゃない。
Suguru | データサイエンティスト
@st_data_science
9 days ago
実務者だからと、AI・機械学習の理論はスルーする人は一定数いるけど、少しでも領域を齧っていればあり得ないミスをし得る。そして導入したモデルが運悪く(?)実運用まで乗った際には、「このモデルは間違ってました」はもう通らない。AI従事者のミスで企業が大きな損失を被るケースは、たまに聞く。
Who to follow
Miyamoto Shota(tota)
@tota_toukei
統計検定®とコース制作についての投稿中心。新作コース集中のためリプライ等もできません。恐縮です。|YouTube:https://t.co/N8xN7UnJzx
kenken
@kenken26679105
48歳。データサイエンス•機械学習•生成AI•Python•ビーチ•ワイン•IPA•妻をこよなく愛するベイジアン。 2021年からPythonの独学開始。国立大学大学院工学修士卒。 本業はAIソリューション開発と新規事業開発(0→1→10)。 Kaggle Expert(notebook)。事業開発支援のご相談はDMへ
ウマたん(上野佑馬) | AI×個人開発
@statistics1012
海外プロダクト成功事例分析(https://t.co/S8uxLkR4Qx)/個人開発(8プロダクト)/Udemy10万人(https://t.co/7VvkdBGh9y)/YouTube6万人/出版書籍2冊/ジョージア在住/エンジェル投資/代表1社取締役2社/世界獲ろう!
Suguru | データサイエンティスト
@st_data_science
10 days ago
『テーブルに状態を持たせてはいけない』 「え!?」ってなったのですが、確かに読んでみると身に覚えがありすぎます。データ設計というと正規化が議論の中心になるけど、こういう観点もあるんですね。 >「会員が退会した」という出来事は事実だが、「現在この会員は退会済みである」という状態は、その事実から導き出された情報にすぎない > 状態を持たせる設計は、状態をUPDATEしてしまうと、それまでの事実が失われる。いつ退会したのか、過去に一度停止されてから復帰したのか、といった経緯は消えてしまう。
farstep
@farstep_
10 days ago
https://t.co/fLIm4rlzco
Suguru | データサイエンティスト
@st_data_science
10 days ago
統計検定が現場で役立つかというと、役立つ時は必ずあると思う。確かに実務データ分析の8割型は、基本統計量の集計で終わる (但しそれまでの道のりも決して簡単じゃない)。ただ、関連分野の学術論文に触れるシーンも必ず出てくるのがこの領域で、その時「分からない」となるのは専門家として苦しい。
Suguru | データサイエンティスト
@st_data_science
11 days ago
DS・AI系の求人は、書いている方が現場の責任者であれ人事であれ、採用当事者の経験が浅い場合が少なからずある。例えば「要件がピンポイント過ぎる」か、逆に「要求言語が多過ぎる」もの。だから求人表を参考にし過ぎると逆に混乱し得る。
Suguru | データサイエンティスト
@st_data_science
15 days ago
失敗談はあまり語られない。データサイエンス・AI系のプロジェクトで成果を出すのは、色々な不確定要素があり、社内・受託関わらず難易度は高い。 この業界は頭も良いし、努力家で人望もある人だらけだけど、それでもDXの成功率はかなり低いのが実態と思う。 DSはなるのも大変だけど、なった後も大変
Suguru | データサイエンティスト
@st_data_science
16 days ago
データサイエンティストは最初1-2年くらい、「噂に聞くあのモデルやこのモデルを実務で試したい」という強烈な欲求があるので、ルールベースでいいと言っても受け入れ難い。実際、転職の要件では「高度な機械学習モデルを構築した経験」とか書いてあるので仕方ないのだが...。
Suguru | データサイエンティスト
@st_data_science
17 days ago
回帰分析での理解の谷って、概念が段々と抽象化されていくことだと思いましたね。最初は高校数学のような立式とOLSで始まるのに、段々と推定量を陽に表せないのが普通になったり、モデルの関数系が省略されたまま話が進む。ただお陰で概念が深層学習にまで繋がっていくので、抽象化は強力。
st_data_science
retweeted
Sesh|広告×データ×AI
@Ssm_wat_89
18 days ago
これは本当にそうだと思います。 最初に解くべきビジネス課題などがあって、その手段としてDSがある。 DS側もこのことを意識するだけで、要望の背景を理解したアウトプットが出せるようになる
Suguru | データサイエンティスト
@st_data_science
18 days ago
データサイエンティスト、毎年定義が変わるのはそもそも「サイエンティスト」としてどうなんだろうか。 そして毎年変わる定義は、果たして定義といえるのだろうか。
Suguru | データサイエンティスト
@st_data_science
19 days ago
今はデータサイエンティストというより、「サブスキルとしてデータサイエンスをかじる」という選択が注目されて良いと思う。 専業DSだと肝心のドメイン知識が足りなくなりやすいし、専門家ゆえに逆に活躍範囲が狭まる側面もある。 データサイエンスは結局のところ手段に過ぎない。
Suguru | データサイエンティスト
@st_data_science
19 days ago
@badchaity
ぜひ、もう少し詳しく教えてください!
st_data_science
retweeted
さとり
@satori_sz9
20 days ago
これ今軽く試したけど革命。 X APIが実質タダになった。
Suguru | データサイエンティスト
@st_data_science
20 days ago
これ読んで逆に「そこまで多くの部署や業務を巻き込めてすごい!」と思うのは自分だけだろうか。 多くのAI・データ推進部が価値提供に難航し、正の費用対効果が得られず、組織再編や吸収合併されているのを目の当たりにしてきた中、これだけ多くの責任を社内で背負えたのはむしろ成功談に聞こえる。
muro / Analytics Engineer
@muro_analytics
22 days ago
失敗談。 データ組織の "便利屋化" が進み、事業側とデータ組織と開発組織の役割分担が不明瞭のまま色んなことに着手し続けると責任と成果が非対称的になり、こういう感じになったことがあります。 データが遅い → データ組織の責任 数字が違う → データ組織の責任 AIが間違える → データ組織の責任 アプリイベントの仕込み → データ組織の責任 KPI/NSM設計 → データ組織の責任 施策が失敗する → データ組織の責任 施策が成功する → 事業部の成果 これを阻止するのがデータ組織の管理職のお仕事。阻止しないとメンバーが死ぬほど疲弊します。最初は全くこんなことになるとは思っておらず、困っている組織や事業を助けたい一心で風呂敷を広げまくっていましたが、気がついたら文句は言われるけど感謝されない組織になっていました。めっちゃつらかったけど自業自得、メンバーには本当に申し訳ないことをしました。 この失敗に気付いてからは、必ずRASICやIPO図で責務範囲や業務フローを合意するようにしました。
See More
Suguru | データサイエンティスト
@st_data_science
20 days ago
これは実データ解析の視点のクイズです。 信頼区間はよく、「標本抽出と区間計算を100回繰り返した場合、そのうちの95回はその区間内に真の値が含まれる」などと、あたかも 『真のデータ構造について、何か厳密なことが言える』かのような説明がされています。 実際には真の分布Qと解析者の設定したモデルPの間には普通、差異が生じます。この真の分布Qをうまく表現するモデルPを、解析者はデータの特性(線形性や独立性など)から質的に判断し設計します。 そのため、信頼区間C(X)は解析者が自ら仮定した統計モデルPに対しては確率的な記述ができるものの、真の分布及びその母数について保証できるわけではないのです。(答え: C)
See More
Suguru | データサイエンティスト
@st_data_science
22 days ago
統計クイズ② 真の分布を Qとし、その期待値をμとする。 解析者はμを推定するため、期待値を θ とする確率分布Pを仮定し、 θ に対する95%信頼区間 C(X) を構成した。 このとき、正しい記述はどれか。 A. C(X) は、μに対する95%信頼区間である。 B. 標本サイズが十分大きければ、C(X) は μに対する95%信頼区間になる。 C. C(X) がμに対する95%信頼区間として妥当とは限らない。 D. μの信頼区間は定義できない。
Suguru | データサイエンティスト
@st_data_science
21 days ago
@muro_analytics
ありがとうございます!
Suguru | データサイエンティスト
@st_data_science
21 days ago
統計クイズ1は、理論的な信頼区間と、信頼区間の実現値を混同しないための問題です。 例えば真の分布をP(X)〜N(μ,1)とすると、標本平均は正規分布に従い、μの信頼区間は[標本平均 ± 1.96×標準誤差]で表せます。これが理論的な信頼区間であり「95%の確率でこの区間はμを含む」と言えるわけです。 しかし、ここに実際にサンプルx1やx2を代入した時点で、信頼区間は一つの固定された実現値になります。 こうなると、C(x1) が μを含むかどうかは、真なら1、偽なら0という決定論的な議論になります。 つまりA,B,Dは全て誤りになるのです。
Suguru | データサイエンティスト
@st_data_science
22 days ago
統計検定が流行っているので、いくつかクイズを作ってみました。 統計クイズ① 同じ95%信頼区間手続きから、あるデータでは狭い区間 C(x1)、別データでは広い区間 C(x2)が得られた。最も適切な説明はどれか。 A. C(x1) の方が、母数を含む確率は低い。 B. C(x2) の方が、母数を含む確率は高い。 C. どちらの個別区間についても、「母数を含む確率」を95%とは言えない。 D. どちらも観測後に95%の確率で母数を含む。
Last Seen Users on Sotwe
阿龙母狗调教营
Seen from
Japan
Rough gay sex
Seen from
Turkey
yerli ifsa
Seen from
Turkey
BARBEN KİZ🍺
Seen from
Turkey
Arzu Sakarya
Seen from
Turkey
💋Phoebe and Fifi💋
Seen from
Turkey
AV Empire
Seen from
Thailand
Sang Penakluk
Jocabed Tamar Galindo Montezuma
Seen from
Panama
Bob
Seen from
Turkey
Trends for you
1
Tupac
Under 10K tweets
2
#SummerGameFest
Under 10K tweets
3
Chicago
Under 10K tweets
4
#RTXPowersPlay
Under 10K tweets
5
Alien Isolation 2
Under 10K tweets
6
CLAIRE REDFIELD
Under 10K tweets
7
Snoop Dogg
Under 10K tweets
8
#SmackDown
Under 10K tweets
9
Soldier Field
Under 10K tweets
10
Cuphead 2
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.1M followers
2
Barack Obama
@barackobama
119.3M followers
3
Donald J. Trump
@realdonaldtrump
111.6M followers
4
Cristiano Ronaldo
@cristiano
108.9M followers
5
Narendra Modi
@narendramodi
107M followers
6
Rihanna
@rihanna
97.3M followers
7
NASA
@nasa
92.1M followers
8
Justin Bieber
@justinbieber
90.6M followers
9
KATY PERRY
@katyperry
86.8M followers
10
Taylor Swift
@taylorswift13
80.6M followers
11
Lady Gaga
@ladygaga
72.1M followers
12
Kim Kardashian
@kimkardashian
69.4M followers
13
YouTube
@youtube
68.6M followers
14
Virat Kohli
@imvkohli
68.5M followers
15
Bill Gates
@billgates
63.4M followers
16
The Ellen Show
@theellenshow
62.5M followers
17
CNN
@cnn
61.9M followers
18
Neymar Jr
@neymarjr
61M followers
19
X
@x
60.9M followers
20
CNN Breaking News
@cnnbrk
59.9M followers
Olivia
Online
✨
⭐
💫