- SDSS: id_galaxia, color, brillo, posición, ...
- IMÁGENES: conjunto de ficheros de imagen; una por cada galaxia del catálogo anterior
- Descripción de los datos de entrada (seguramente ya se da en la semana 1)
- Descripción del objetivo: modelo de datos para entrenamiento popular(?)
-
Explorar el dataset de las imágenes con más profundidad
-
Explorar el dataset de las galaxias con más profundidad
-
Definir (o completar) el modelo de datos para el entrenamiento popular. Detallar las tablas, campos y tipos de datos.
GALAXIA ---< VOTO >--- USUARIO
- Cuántas imágenes hay? Que tamaño tienen en total?
- Cuántas galaxias hay? En total? Que cumplan la propiedad X?
- Dados los ids de X galaxias, seleccionar las que son espirales (o elípticas)
- Si queremos clasificar los resultados por edad, cómo lo hacemos? Qué campo ponemos, de que tipo y dónde?
- Si queremos clasificar los resultados por estado, cómo lo hacemos? Qué campo ponemos, de que tipo y dónde?
- Si queremos clasificar los resultados por tiempo de respuesta, cómo lo hacemos? Qué campo ponemos, de que tipo y dónde?
- Cuál es el SQL para saber cuántos votos ha hecho un usuario?
- Cuál es el SQL para saber cuántos votos tiene una galaxia?