✨DATA SCIENTIST ROADMAP✨
Long tweet on the required knowledge for becoming a data scientist from my experience:
1) Statistics fundamentals
1.1) Measuring probability
1.2) Combinatorics and Permutations
1.3) probability axioms
1.3) Conditional probability
1.4) Distributions
1.5) Random Variables
1.6) Expected Value
1.7) Central tendency measurements and sampling
1.8) Hypothesis testing
1.9) Boostrapping
2) Linear algebra fundamentals
2.1) Vectors
2.2) Operations between vectors
2.3) Cross product and Dot product
2.4) Matrix multiplication
2.5) Inverse Matrix
2.6) Linear Transformations
2.7) Gradient descent
3) Advanced SQL
3.1) Common DML operations
3.2) Common DDL and DQL operations
3.3) Joining tables (anti joining too)
3.5) Subqueries
3.6) Group by
3.7) Having vs Where
3.8) UNION
3.9) Temporal tables vs subqueries
3.10) Creating tables from queries
3.11) DB Engine architecture fundamentals
3.12) Query optimizer fundamentals and expected path
4) Intermediate level Python, Pandas, Numpy and Matplotlib
4.0) Python fundamentals:
4.0.1) Common data structures
4.0.2) Conditional flow
4.0.3) Iteration structures
4.0.4) Functions
4.0.5) Objects and classes
4.0.6) Packages, PIP and importing
4.0.7) Namespaces
4.0.8) Inheritance
4.1) Data collection (Models Lifecycle)
4.2) Data preparation (Models lifecycle)
4.3) Data wrangling and transformation (Models lifecycle)
4.4) Data plotting (Models lifecycle)
5) ML algorithms
5.1) Classic ML models: Linear Regression, Logistic Regression, Clustering, Random Trees, KNN, Support Vector Machines
5.2) N-fold cross validation
5.3) Categorical values handling
5.4) Normalization and Standardization
5.5) Checking for correlated features
5.6) Bias vs variance tradeoff
5.7) Important effectiveness metrics of each model
5.8) Fine tuning parameters and hyperparameters
6) Deep Learning
@labestiapau y por que ese potencial todavia no está? Es cuestión de ir levantando poco a poco. No digo que sea facil pero siempre y cuando que tengas 2 pies, 2 brazos y una mente consciente, ese potencial todavia existe :)
This is just ego talk. It is not constructive nor useful as a “review”
It doesnt specify whats wrong or how to improve it. This is the same as just saying “you are not at my level”
@ShellWinger Eso es algo que hace Boca, River, Flamengo, Palmeiras, Fluminense, Peñarol, En europa practicamente es el status quo desde hace mas de 40 años, ...
No podemos poner cualquier cosa donde hay extranjeros como problema porque los problemas reales dejan de serlo
Quise hacer un follow-up a estas simulaciones, viendo el impacto de la cantidad de personas con la que puedes intercambiar stickers:
1. Los costos pueden bajar hasta 1/10 de lo que gastariamos siendo una sola persona
2. El peor y mejor caso se acercan, lo cual baja costos
El álbum del Mundial 2026 tiene 980 estampas. En promedio, necesitas ~1050 sobres para llenarlo.
Pero no te preocupes, puedes reducir la cantidad… si toleras interactuar con humanos 😰
Intercambiando (% del álbum):
10% → ~322 sobres
20% → ~225 sobres
Ni modo, a convivir.
@AlllShuffle@Juanse629@AlejaaRojasg pero que esta persona no esté en la carcel no es ser justo con las partes.
El dejó a todas estas personas como victimas, mostrarlo de esta forma es minimizar lo que hizo.
El debe pagar por las consecuencias del terror que inflingió. Sus actos son impunes por “perdon”
@AndreyDonato1@tobonvillada@feliphebotero es muy logico lo que planteas, la verdad, si te dicen algo, eso se resuelve persiguiendo a alguien y disparar una pistola
muy civilizado todo y para nada tercermundista
@luismejiadev Wow, lamento oir lo del divorcio 🫂
Yo tengo que decir que me da mucho miedo defraudar tecnicamente o quedarme sin soluciones o perderlo todo
quisiera oir qué lecciones aprendidas has tenido y espero que vayas bien 🫂
@naviumco@marianorenteria Cuando hablamos de cualquier cosa basada en inteligencia artificial, eso nunca es suficiente ya que estos modelos estan hechos para tener SIEMPRE un margen de error, por ejemplo, yo hice esto con la de Meli
Meli siendo una empresa gigante de software
yo NUNCA dejaria que un agente tome decisiones de EDA ni modelado por mi
Me suelo apoyar para ideas pero nunca nunca que haga esas cosas por mi porque el cientifico de datos tiene que tener un entendimiento de qué se definió y qué resultados se obtuvo
@excel_file A ver, yo no me atreveria a decir que es logico y que no es jajajaj después de tantos proyectos en el area a veces lo logico no lo es tanto :)
LA REGRESIÓN LINEAL NO IMPLICA UNA LINEA (GEOMETRICAMENTE)
el supuesto es que se es lineal con respecto a los parametros B0, B1…
No pide linealidad con respecto a las features necesariamente, permitiendo cosas como esto:
@leonpalafox el tema es la interpretabilidad y que para datasets muy grandes es una operacion pesadisima
ademas del hecho de que hay que seleccionar los suficientes componentes como para cubrir gran parte de la varianza del dataset pero normalmente siempre se tiene un decompression error