Culturomics: Books Ngram Viewer



Books Ngram Viewer Con este buscador, inaugurado por Google o 16 de decembro de 2010, podemos ver gráficamente a frecuencia de palabras ou frases (hasta 5 palabras) ao longo da historia. Remitíndonos, posteriormente, ás fontes nas que aparecen no seu contexto. Algúns expertos comezan a falar de Culturomics para analizar as tendencias culturais ao longo da historia reflictida nos libros. Para elo, Google baséase na súa inmensa biblioteca dixitalizada. Estímase que, dende a invención da imprenta, publicáronse 129 millóns de libros, dos cales Google escaneou 12; deles, 5 están na base de datos deste visor. Pódense facer búsquedas de frecuencias de palabras e/ou frases por anos e en 11 idiomas; entre eles, o español. (Vía, Tercera cultura)

Las bases de datos que estamos haciendo hoy disponibles para la investigación en humanidades se basan en un subconjunto de un corpus que contiene 500 mil millones de palabras en 5,2 millones de libros en chino, Inglés, francés, alemán, ruso y español. Los conjuntos de datos contienen frases de hasta cinco palabras con un recuento de la frecuencia con que ocurrieron en cada año. (…) El Visor de Ngram le permite graficar y comparar frases de estos conjuntos de datos a través del tiempo, mostrando cómo su uso ha sufrido altibajos en los últimos años. (Jon Orwant, Equipo de Google Books).


Ver unha explicación máis detallada nos artigos de Ricardo Martínez (TerceraCultura.cl):

CULTUROMICS: el corpus más grande del mundo, by GOOGLE

El “corpus” de Google Books: ¿genoma o juguete?

Comentarios

Entradas populares de este blog

AFACERSE Á AUSENCIA: ANXO PINTOS LAMOSO