Piensa en tus bases de datos abiertas favoritas.
Estoy seguro de que la Wikipedia y IMDb se me vienen a la mente al instante, pero puede que no necesites todo ese conocimiento, o una base de datos completa de todo lo relacionado con el entretenimiento. A veces necesitas un poco de sabor VLDB (base de datos muy grande). Algo para darle más sabor a su análisis de datos Cómo convertirse en un científico de datos Cómo convertirse en un científico de datos La ciencia de datos ha pasado de ser un término recientemente acuñado en 2007 a ser una de las disciplinas más buscadas en la actualidad. Pero, ¿qué hace un científico de datos? ¿Y cómo puedes irrumpir en el campo? Lee mas . Algo para poner lo "grande" en sus grandes datos. Cachorro, buena persona, estás en el lugar correcto.
Aquí hay 15 bases de datos masivas en línea. Entonces, ¿qué es una base de datos? [MakeUseOf Explains] Entonces, ¿qué es una base de datos? [MakeUseOf Explains] Para un programador o un entusiasta de la tecnología, el concepto de una base de datos es algo que realmente se puede dar por hecho. Sin embargo, para muchas personas el concepto de una base de datos en sí es un poco extraño ... Leer más puede acceder y analizar de forma gratuita Excel vs. Acceso: ¿puede una hoja de cálculo reemplazar una base de datos? Excel vs. Acceso: ¿puede una hoja de cálculo reemplazar una base de datos? ¿Qué herramienta deberías usar para administrar los datos? Access y Excel incluyen filtrado de datos, intercalación y consultas. Le mostraremos cuál es el más adecuado para sus necesidades. Lea más, o simplemente lea a su gusto.
1000 genomas
La finalización en 2003 del Proyecto del Genoma Humano (HGP) fue solo el comienzo. Desde entonces, los avances en la tecnología de secuenciación han reducido enormemente el costo por persona, permitiendo una gran expansión del HGP desde su base de investigación inicial de veinte laboratorios universitarios, hasta una red globalizada y expandida de instalaciones de mapeo genómico interconectado.
Puede descargar parte del Proyecto 1000 Genomes, que contiene información de secuenciación para más de 2, 600 personas de 26 poblaciones de todo el mundo. Este es un archivo de 200TB, así que prepárate. Sugerimos usarlo junto con una poderosa plataforma de computación en la nube.
Ver también: Base de datos de tamaño de genoma animal para datos genómicos relacionados con 5635 especies.
Aviones de pasajeros
Los planespotters cielo. Una base de datos de imágenes masiva con 2.532.457 fotografías de todo tipo de aeronaves, desde la embarcación individual más pequeña hasta enormes fortalezas voladoras.
Airliners también cuenta con una extensa sección de datos e historial de aeronaves que se mantiene actualizada en cooperación con Aerospace Publications para garantizar la precisión de los hechos. Esto lo ha convertido en una de las bases de datos de aeronaves más detalladas en Internet.
Vea también : Pruebe Planespotters.net para una gama diferente de imágenes, o SeatGuru para esquemas de asientos de aviones.
El Archivo de Internet
El sitio anteriormente conocido como The Internet Archive, ha pasado por un rediseño masivo. El sitio no ha cambiado mucho desde 2002, pero ha cambiado mucho desde entonces. Internet Archive ha hecho aún más crecimiento desde los primeros días.
Al archivar todo en Internet, el sitio le brinda acceso gratuito a medios digitales, incluidos libros, música y juegos. Internet Archive trae 900 juegos clásicos de Arcade a su navegador. Here Are 7 Of The Best Internet Archive trae 900 juegos clásicos de Arcade a su navegador. Aquí están 7 de lo mejor Es posible que la sala de juegos de su ciudad se haya cerrado a mediados de los 90, pero eso no debería impedir que consiga la reparación de su clásico juego. Lea más, videos y mucho más. La colección se estima actualmente en alrededor de 10 petabytes Explicación de los tamaños de memoria: gigabytes, terabytes y petabytes en términos de Layman Explicación de los tamaños de memoria: gigabytes, terabytes y petabytes en términos Layman Es fácil ver que 500GB es más de 100GB. ¿Pero cómo se comparan los diferentes tamaños? ¿Qué es un gigabyte a un terabyte? ¿Dónde encaja un petabyte? ¡Vamos a aclararlo! Lea más y, a medida que sus webcrawlers sigan reptando, seguirá creciendo.
Freebase
Freebase es "una base de datos curada por la comunidad de personas, lugares y cosas conocidas", almacenada en una estructura de datos denominada gráfica . Un gráfico se compone de nodos, conectados por sus bordes, lo que permitió a Freebase expandir rápidamente su contenido sin interrumpir los registros existentes.
Desafortunadamente, Freebase, propiedad de Google, cambió al modo de solo lectura a principios de este año, antes de que la base de datos del servicio independiente se transfiriera a la Fundación Wikimedia para su integración. Pruebe las funciones Beta en Wikimedia y obtenga una vista previa Novedades antes de que nadie pruebe las características Beta Wikimedia y vista previa Novedades antes de que nadie más El programa de características Beta de Wikimedia permitirá a cualquier persona probar las próximas nuevas características en Wikimedia y sus wikis. Únete y ayuda a que Wikimedia sea una experiencia mejor para todos nosotros. Lea más en el proyecto Wikidata (finales de junio de 2015). Los desarrolladores todavía pueden acceder a Freebase usando las API existentes, pero una vez que se realiza el cambio, los desarrolladores tendrán que usar las API de Wikimedia para acceder a los datos.
Encuentra un sepulcro
Desde la base de un equipo onírico de conocimiento de Internet de Google y Wikimedia, pasamos a lo mórbido. Find a Grave es una base de datos masiva de 121 millones de enterramientos en todo el mundo.
Los registros más completos provienen de EE. UU., Pero hay algunos países más pequeños con grandes datos. Completo con fotos, monumentos interesantes y una serie de interesantes epitafios ... ¿si necesitas inspiración?
GameRankings
Una base de datos mantenida por el equipo de revisión siempre presente en Gamespot. GameRankings ofrece una descripción completa de la popularidad de un juego al cubrir reseñas de juegos en línea y fuera de línea de fuentes confiables. 6 lugares para averiguar cuáles son los mejores videojuegos. 6 lugares para averiguar. Cuáles son los mejores videojuegos de la historia. Es natural. para un entusiasta de los videojuegos, preguntarse cuáles son los mejores juegos que se han hecho alguna vez, o al menos lo que los expertos creen que son los mejores. Lee mas .
La base de datos de Big Cartoon
En una línea similar a la IMDb masiva, The Big Cartoon Database se enfoca exclusivamente en todas las cosas animadas: caricaturas, películas, programas de televisión, anuncios y más. Si se trata de una animación, la encontrará aquí; de lo contrario, regístrese como colaborador de esta base de datos en constante crecimiento.
La base de datos Big Cartoon tiene un sitio hermano en The Big Comic Database, que alberga 100.000 registros de historietas más. 9 Videojuegos Tebeos temáticos Libros que debes leer 9 Videojuegos Tebeos temáticos Libros que debes leer Es hora de apagar e ir a cama. Pero todavía estás ansioso por jugar a tu juego favorito. Necesitas relajarte, entonces ¿por qué no leer tu juego favorito? Lea más, abarcando unas 5, 000 series, con más de 35, 000 escaneos de portada. También contiene una función de búsqueda exhaustiva, que incluye una guía de precios de cómics que detalla los valores actuales de reventa en los distintos niveles de clasificación.
Ver también : The Grand Comics Database, una base de datos empresarial no comercial de comics en todo el mundo.
CiteSeer X
Una herramienta invaluable para los estudiantes Crear Bibliografías y citas de notas es más fácil con Bookends para Mac Crear Bibliografías y citas de notas es más fácil con Bookends para Mac Bookends para Mac prácticamente realiza las tareas de búsqueda de citas y de investigación para usted. Lea más y académicos por igual, CiteSeer X es un motor de búsqueda pública y una biblioteca digital de documentos académicos y científicos. A menudo considerado el primer sistema de indexación de citas automáticas, fue la inspiración para Google Académico y Microsoft Academic Search. Aunque este último se ha integrado desde entonces en el motor de búsqueda de Bing.
CiteSeer X se centra en la indexación de documentos académicos públicos. Si su artículo de investigación se distribuye abiertamente, tiene una mayor probabilidad de aparecer dentro del motor de búsqueda. CiteSeer X es un excelente ejemplo del poder del conocimiento compartido disponible para una audiencia mucho más amplia.
Ver también : Google Scholar para una variedad diferente de libros y citas.
WorldCat
Lamentablemente, no hay una base de datos de cada foto de gato en Internet. ¡Eso sería algo! WorldCat es mucho más útil que eso. El sitio de referencia documenta las colecciones de más de 72, 000 bibliotecas de todo el mundo, que cubren 170 países y territorios. Esto es útil si está investigando en un país extranjero o simplemente desea leer libros raros en persona.
El único inconveniente es el método de actualización. WorldCat utiliza un modelo de procesamiento por lotes en lugar de permitir que los usuarios accedan a los datos en tiempo real. Por lo tanto, WorldCat no indica el estado del préstamo de los libros catalogados, si una biblioteca posee varias copias de un libro, o si el libro en cuestión es directamente accesible para aquellos que deseen visitarlo. Todavía es una herramienta muy útil, especialmente cuando se usa junto con CiteSeer X.
El archivo Simpsons
"El centro de intercambio de información de guías, noticias e información de Simpson." No podría haberlo dicho mejor. El antiguo favorito de los fanáticos comenzó allá por 1994, y todavía se está fortaleciendo incluso sin multimedia interactiva, aunque solo sea para escapar de la atenta mirada del departamento legal de Fox.
WinCustomize
Encontrará una de las bases de datos más grandes de herramientas de personalización para Windows. Cómo personalizar sus efectos de sonido de Windows Cómo personalizar sus efectos de sonido de Windows Puede hacer que su computadora suene como su programa de TV favorito, grabar sus propios sonidos o apagarlos por completo . Aquí hay un curso acelerado sobre el cambio y la grabación de efectos de sonido para Windows. Lea más aquí, desde XP hasta Windows 8.1 10 Windows 8 Start Screen Hacks 10 Windows 8 Start Screen Hacks Windows se está moviendo hacia una dirección más bloqueada con Windows 8 y su pantalla de inicio y el entorno de la aplicación "Moderno". No se puede negar esto: ni siquiera puede establecer un fondo de pantalla de inicio personalizado sin instalar ... Leer más. Estoy seguro de que no pasará mucho tiempo antes de que Windows 10 comience a hacer las rondas. Su gran popularidad se debe a una combinación de fuerzas. El propietario Stardock, subsidia el sitio, lo que significa que hay pocos anuncios publicitarios. También se beneficia de la cantidad de personas canalizadas al sitio desde Stardock.
Ultimate Guitar Archive
Ah, un viaje por el camino de la nostalgia a una base de datos que me recuerda que nunca fui Roger Waters. De hecho, todavía puedo jugar, pero esa es otra historia.
The Ultimate Guitar Archive, o simplemente Ultimate-Guitar (UG), tiene más de 1, 500, 000 miembros registrados en todo el mundo, que supervisan una cantidad ridículamente grande de contenido de la comunidad. Es casi alucinante la cantidad de información relacionada con la guitarra se dispersa desde una sola fuente. La comunidad simplemente no mantiene una base de datos masiva, también colaboran frecuentemente entre sí para crear proyectos de música en expansión.
Plantas para un futuro
Plants for a Future documenta la horticultura ecológicamente sostenible. Tiene una gran influencia en la difusión del conocimiento sobre la diversidad de especies y la importancia de la permacultura. Lo que comenzó como un pequeño proyecto en las profundidades de Cornwall ha crecido lentamente hasta convertirse en una base de datos mundial.
El crecimiento es algo lento, y se centra principalmente en la permacultura en el Reino Unido y la UE, pero muchos de los registros se pueden intercambiar por ubicaciones específicas en los EE. UU. Una vez que tenga los detalles de la especie.
Quandl
Arranque con este complemento de Excel para procesar y analizar datos Power Up Excel con 10 complementos para procesar, analizar y visualizar datos como un Pro Power Up Excel con 10 complementos para procesar, analizar y visualizar datos como un Pro Vanilla Excel es increíble, pero puede hacerlo aún más poderoso con complementos. Independientemente de los datos que necesite procesar, es probable que alguien haya creado una aplicación Excel para ello. Aquí hay una selección. Lee mas . El sitio principal de Quandl actúa como una búsqueda en la base de datos, localizando bases de datos de todo el mundo que coinciden con sus términos de búsqueda. Pruébalo si necesitas datos extra a toda prisa, o simplemente juega con grandes conjuntos de datos (¿quién no?).
Ver también : El motor de búsqueda de la base de datos Enigma.
Tiny Images
El conjunto de datos Tiny Images actúa como un diccionario visual. Haga clic en cualquier parte de la imagen y aparecerá un término de búsqueda con información adicional. También puede usar términos específicos para filtrar 80 millones de imágenes .
La base de datos es parte de un proyecto de aprendizaje automático más amplio. Cómo el software inteligente va a cambiar tu vida. Cómo el software inteligente va a cambiar tu vida. Skynet está por llegar, y será increíblemente popular. Están surgiendo nuevas tecnologías de inteligencia artificial que cambiarán la forma en que vivimos, jugamos y trabajamos. Read More se centró en la enseñanza de computadoras para "ver" y "leer" campos semánticos dentro de las imágenes.
Fuente de bonificación: / r / datasets
La "página de inicio de Internet" es un hogar sólido para los entusiastas de la minería de datos de todo el mundo. Hay subreddits dedicados al aprendizaje automático, minería de datos, texto a datos y conjuntos de datos. Si necesita algo específico, realice una solicitud. Nuevos conjuntos de datos aparecen todas las semanas.
Tenga cuidado con los conjuntos de datos interesantes publicados como los Niveles de Inmunización en Child Care and Schools for California.
¿Usas la riqueza?
Internet ha creado la oportunidad más clara para que las personas se reúnan y puedan concentrar sus conocimientos en una única base de datos. Estamos tratando valientemente de documentar todo sobre cualquier cosa. Algunas de estas bases de datos son para leer, otras son para aprender Cómo usar una tabla dinámica de Excel para el análisis de datos Cómo usar una tabla dinámica de Excel para el análisis de datos La tabla dinámica es una de las herramientas más poderosas del repertorio de Excel 2013. Se utiliza con frecuencia para el análisis de datos de gran tamaño. Siga nuestra demostración paso a paso para aprender todo al respecto. Lea más, pero esperamos que los disfrute a todos.
¿Cuáles son tus bases de datos favoritas? ¿Hay alguna fuente de referencia masiva abierta que debería haber incluido en esta lista?
Créditos de imagen: servidor de red a través de Shutterstock, biblioteca a través de Shutterstock