¿Qué significa ser un científico de datos?
El término es reciente; ha sido todo un cambio en la industria. Se dieron cuenta de que esos científicos que estábamos ahí metidos en un laboratorio, que pensaban que estábamos aislados, en realidad no. Con nuestro conocimiento y aplicando el método científico a los datos de una empresa u organización, se puede crear mucho valor.
¿Cómo llegó a convertirse en un científico de datos?
Cuando estuve en Intel. El analizar y procesar datos era parte de mi trabajo. En ese momento, el enfoque era transformarlos, procesarlos. Luego me fui a Japón, ahí fue donde mi profesor, mi sensei , me habló de similitud. Ese es un concepto fundamenta l para hacer ciencia de datos. Conforme fue pasando el tiempo, aprendí, hasta llegar a aplicarlo en diferentes campos. En ese tiempo me enfoqué en el de la propiedad intelectual; luego, en Alemania, en datos genómicos.
¿Qué es la similitud?
Eso es mejor representado con la historia de los tomates: si usted va al supermercado a comprarlos, usted sabe que un tomate es bueno porque en su memoria tiene ejemplos de buenos tomates, y sabe cuál es es malo porque tiene en su memoria ejemplos de malos tomates (...). En Japón, yo apliqué esto para lo que eran violaciones de licencia de software libre, pues si usted usa software libre, dependiendo de la licencia, usted tiene que compartir de vuelta con la comunidad. En Alemania lo hice con células madre.
¿Cómo usaba la similitud en un organismo biológico?
La célula es como una maquinita, cuando recibe ciertos estímulos, genera ciertas cosas y eso es un ciclo. El problema es que no sabemos cómo esos ciclos se realizan enteramente.
”La similitud ayuda a predecir cómo es que esos ciclos van a ir, para que podamos crear mejores medicinas, o mejores maneras de convertir células epiteliales (de la piel) en células cardíacas y así, en el futuro, curar a alguien con sus propias células. Eso se llama reprogramación”.