🗃 Guía para crear una base de datos con metadatos Dublin Core

Esta guía te explica paso a paso cómo crear una base de datos en formato .csv que pueda usarse en herramientas como Google Colab, VS Code o JupyterLab, utilizando la clasificación estándar de metadatos Dublin Core.

🎯 1. Define el propósito de tu base de datos

Antes de comenzar, responde:

¿Qué tipo de datos vas a registrar? (Ej: libros, películas, entrevistas, objetos digitales)
¿Para qué se usará esta base? (Análisis, archivo, visualización, etc.)
¿Quién la consultará?

Ejemplo: Una base de datos de novelas de ciencia ficción escritas por mujeres entre 2000 y 2025.

🧱 2. Diseña la estructura usando Dublin Core

Usa campos del estándar Dublin Core Metadata Element Set como encabezados de tus columnas.

📊 Tabla de campos recomendados (Dublin Core simplificado)

Campo `csv`	Descripción
`id`	Identificador único por fila (obligatorio)
`title`	Título del recurso
`creator`	Autor/a o creador/a
`subject`	Temas o palabras clave
`description`	Breve resumen del contenido
`publisher`	Editorial o entidad responsable
`contributor`	Otras personas que colaboraron
`date`	Fecha de publicación o creación
`type`	Tipo de recurso (libro, artículo, audio, etc.)
`format`	Formato del archivo o medio
`identifier`	ID externo (ISBN, DOI, URL, etc.)
`source`	Fuente de origen
`language`	Idioma
`relation`	Relación con otras obras
`coverage`	Cobertura geográfica o temporal
`rights`	Derechos de uso o licencia

📌 El campo id debe ser único para cada línea de datos (bk001, bk002, etc.).

📂 3. Crea tu archivo `.csv`

Abre Google Sheets, Excel o un editor de texto plano.
Usa los encabezados anteriores como la primera fila.
Llena cada fila con los datos correspondientes.
Guarda el archivo como mi_base_de_datos.csv.

📘 Ejemplo de contenido `.csv`:

id,title,creator,date,publisher,language,identifier
bk001,Kindred,Octavia E. Butler,1979,Beacon Press,en,978-0807083697
bk002,La mujer habitada,Gioconda Belli,1988,DASA,es,978-958-05-0372-6
bk003,Los recuerdos del porvenir,Elena Garro,1963,Joaquín Mortiz,es,978-968-27-0123-4

🖥 4. Carga tu base en Google Colab o VS Code

En Google Colab:

import pandas as pd
from google.colab import files

uploaded = files.upload()
df = pd.read_csv("mi_base_de_datos.csv")
df.head()

En VS Code o Jupyter:

import pandas as pd

df = pd.read_csv("ruta/a/mi_base_de_datos.csv")
print(df.head())

🧹 5. Limpieza y validación de los datos

Verifica que cada id sea único.
Asegúrate de no dejar columnas clave vacías (title, creator, date).
Usa formatos consistentes: fecha (YYYY), idioma (es, en), tipo (Libro, Ensayo, etc.).

📝 6. Documenta tu base

Acompaña tu archivo .csv con un README.md que contenga:

Objetivo del proyecto
Descripción de las columnas
Fuente de los datos
Fecha de elaboración
Licencia o derechos de uso

🧾 Plantilla `.csv` de ejemplo

👉 Descargar plantilla CSV de ejemplo

📌 Recomendaciones finales

Usa OpenRefine para depurar y estandarizar los datos.
Mantén consistencia terminológica y de formato.
Si planeas escalar, considera una base de datos como SQLite o Airtable.

🖼️ ¿Cómo agregar audios, imágenes o videos a tu base de datos?

Si quieres enriquecer tu base de datos con archivos multimedia —como imágenes, audios o videos—, puedes hacerlo de varias maneras según el nivel técnico y los objetivos de tu proyecto.

✅ Opción 1: Vincular archivos multimedia desde tu archivo `.csv`

Puedes agregar columnas adicionales con enlaces a los recursos multimedia:

id	title	image_url	audio_url	video_url
bk001	Kindred	assets/images/img1.jpg	assets/audio/01.mp3	assets/video/clip1.mp4

Asegúrate de que los archivos estén disponibles públicamente en tu repositorio, por ejemplo:

/assets/images/
assets/audio/
assets/video/

También puedes usar URLs externas (como YouTube, SoundCloud, etc.).

🔍 Recomendaciones

Añade campos como image_caption, audio_transcript, video_language, etc., si deseas más control o accesibilidad.
Usa nombres de archivo coherentes con los IDs (img_bk001.jpg, audio_bk001.mp3, etc.).

✅ Opción 2: Usar plataformas como Omeka o CollectionBuilder

Estas plataformas permiten asociar archivos multimedia a cada ítem descrito con metadatos como Dublin Core.

Omeka.net: Plataforma de exhibición digital para humanidades y archivos. Permite importar metadatos y subir archivos.
CollectionBuilder: Funciona con GitHub Pages y Jekyll. Lee un .csv, carga medios desde /assets/ y genera un sitio navegable.

✅ Opción 3: Integrar medios en visualizaciones interactivas (Jupyter/Colab o HTML)

Si estás trabajando en Jupyter Notebooks o Google Colab, puedes insertar los medios directamente desde los datos:

from IPython.display import Image, Audio, HTML
Image(filename='assets/images/img1.jpg')
Audio(filename='assets/audio/01.mp3', autoplay=True)

También puedes usar HTML en sitios estáticos para incrustar los recursos en páginas personalizadas.

📁 Estructura de carpetas recomendada

/assets/
├── data/
│   └── mi_base.csv
├── images/
│   └── img1.jpg
├── audio/
│   └── 01.mp3
└── video/
    └── clip1.mp4

En el .csv:

id,title,image,audio,video
bk001,Kindred,assets/images/img1.jpg,assets/audio/01.mp3,assets/video/clip1.mp4

Esto facilitará cargar los medios desde tu base de datos y mantener todo organizado y visible desde GitHub Pages u otras plataformas.