¿Dónde obtienen sus datos los sitios de servicios de genealogía como ancestry.com y geni.com?

Cuando eran una empresa pública, Ancestry reveló que gastaban $ 30 millones cada año para desarrollar contenido. La mayor parte de ese costo es la indexación de registros públicos. Hace unos 10 o 15 años, la regla de oro era que la digitalización de la imagen de una página costaba un centavo y la digitalización del texto costaba una cuarta parte si se escribía a máquina o un dólar si se escribía a mano. Estas fueron las reglas básicas, pero si considera un título como el Censo de los Estados Unidos de 1930, le costaría millones hacer un índice de búsqueda vinculado a las imágenes.

Como se ha sugerido en otros lugares, estos costos a veces llevan a las empresas a colaborar. Un acuerdo común con la Iglesia SUD podría incluir que proporcionen imágenes digitales de los registros, mientras que el editor proporcionará el índice de nombres, edades, etc.

Antes de aproximadamente 2000, la mayor parte del contenido de Ancestry era índices y árboles contribuidos por el usuario. Desde entonces, han creado una enorme base de datos de registros públicos como el censo, las listas de votantes, los registros militares y las pensiones, los registros vitales como el nacimiento, el matrimonio y la muerte, y el índice de muerte de la seguridad social. Su esperanza es que cada persona que visite el sitio reciba visitas al nombre que conoce, de modo que su interés sea encendido y tratarán de encontrar más registros sobre esas personas.

Y sí, los usuarios siguen aportando árboles genealógicos. Hay millones de ellos, pero no son tan “universales” como un censo. Volviendo al censo de 1930 como ejemplo, hay alrededor de 130 millones de nombres en él. Ancestry tenía un millón de suscriptores que podrían tener 15 personas únicas para realizar un seguimiento en el censo de 1930. Por supuesto, no todos eran únicos: muchos clientes buscaban a las mismas personas, pero si fueran EXCEPCIONALES, a esos clientes solo les interesaría y publicarían árboles genealógicos, aproximadamente el 12% de las personas en el censo. El contenido del usuario fue solo la punta del iceberg, a partir de ese análisis.

No tengo idea de qué información hay en Geni o de dónde viene.

Cuando trabajé en Ancestry hace más de diez años, había un pequeño equipo de personas que autorizaba las bases de datos de datos genealógicos de varias fuentes diferentes, incluidos los partidos privados, otros genealogistas, religiosos, estatales y las instituciones públicas. Ese personal es mucho más grande ahora. También tienen mayores recursos que antes. No todas las bases de datos de registros son públicas, muchas están definidas de forma limitada y de fuentes privadas. Estos son a menudo difíciles de encontrar. Ancestry gasta una gran cantidad de dinero en la búsqueda, licencia y preparación de bases de datos para su servicio de suscripción.

La gran mayoría de ellos, particularmente los grandes conjuntos de conexiones y cualquier otra cosa que no sean datos biológicos básicos, provienen de los usuarios. Para los sitios que incluyen datos de fuentes primarias, como Ancestry, las transcripciones de registros gubernamentales (censos, registros de nacimiento, etc.) proporcionan los datos sin procesar que los investigadores pueden utilizar para crear árboles genealógicos. Hay sitios que se especializan en fuentes primarias digitalizadas, algunos que se especializan en árboles genealógicos y otros que hacen ambas cosas.

Muchos sitios de genealogía como Ancestry.com usan datos de registros históricos públicos, al igual que los datos del censo de 1940 que se dieron a conocer recientemente. Sé que Ancestry.com está afiliada a Vitalchek.com para ordenar registros reales como certificados de nacimiento, defunción, matrimonio y divorcio. VitalChek es una fuente oficial de registros vitales emitidos por el gobierno para cientos de agencias gubernamentales de los Estados Unidos y los territorios de los EE. UU., Por lo que usar el sitio web de ancestry.com para realizar pedidos directamente a VitalChek es una forma segura de hacerlo.

La base de la información de ancestry.com proviene del análisis de texto de los datos del censo de EE. UU. Esto incluye nombres, direcciones y ocupaciones. Esto se complementa con otros registros estatales y federales y se vincula con los árboles genealógicos generados por los usuarios.

Ancestry.com se nutre de los recursos extensos de la iglesia mormona cuyos miembros hacen genealogía como un principio de la fe. La Iglesia Mormona extrae de todas partes, registros gubernamentales de muchos países de todo el país.
El mundo, los archivos nacionales en todo el mundo y se agregan constantemente a la base de datos.
Luego, los usuarios publican sus árboles genealógicos utilizando esa extensa base de datos para realizar su investigación, pero la base de datos en sí no es generada por los usuarios.