Personal genomes in progress: from the human genome project to the personal genome project

Dialogues Clin Neurosci. 2010;12(1):47-60. doi: 10.31887/DCNS.2010.12.1/jlunshof.

Abstract

The cost of a diploid human genome sequence has dropped from about $70M to $2000 since 2007--even as the standards for redundancy have increased from 7x to 40x in order to improve call rates. Coupled with the low return on investment for common single-nucleotide polylmorphisms, this has caused a significant rise in interest in correlating genome sequences with comprehensive environmental and trait data (GET). The cost of electronic health records, imaging, and microbial, immunological, and behavioral data are also dropping quickly. Sharing such integrated GET datasets and their interpretations with a diversity of researchers and research subjects highlights the need for informed-consent models capable of addressing novel privacy and other issues, as well as for flexible data-sharing resources that make materials and data available with minimum restrictions on use. This article examines the Personal Genome Project's effort to develop a GET database as a public genomics resource broadly accessible to both researchers and research participants, while pursuing the highest standards in research ethics.

El costo de una secuencia del genoma humano diploide se ha reducido desde cerca de 70 millones de dólares a 2000 dólares desde 2007, aunque los estándares de la redundancia han aumentado de 7 a 40 veces para mejorar los índices de demanda de genotipo. Junto con el bajo retorno de inversión para los polimorfismos de nucleótidos únicos comunes, esta situatión ha causado un aumento significativo del interés en correlacionar las secuencias genómicas con una completa información ambiental y de rasgos (GAR). El costo de las fichas médicas electrónicas, de las imágenes y de la información microbiológica, inmunológica y conductual también está reduciéndose rápidamente. El compartir tal conjunto de información y sus interpretaciones con una diversidad de investigadores y sujetos de investigación pone de relieve la necesidad de contar con modelos de consentimiento informado capaces de estar orientados hacia nuevos temas de privacidad y otros, además de flexibilizar los recursos de datos compartidos que permitan disponer de materiales e información con mínimas restricciones de uso. Este artículo examina el esfuerzo del Proyecto de Genoma Personal para desarrollar una base de datos de GAR como un recurso de genómica pública ampliamente accesible tanto a investigadores como a participantes de las investigaciones, respetando los estándares más elevados de la ética de la investigación.

Le coût de séquençage d'un génome diploïde humain a chuté de 70 millions de dollars à 2 000 dollars depuis 2007, bien que les standards de redondance aient augmenté de 7 à 40 fois afin d'améliorer le taux d'identification des bases. Associé au faible retour sur investissement des polymorphismes de simples nucléotides (SNP), cette situation explique l'intérêt accru pour la corrélation des séquences des génomes avec des données complètes environnementales et de traits (GET). Les coûts des enregistrements numériques médicaux, de l'imagerie et des données microbiennes, immunologiques et comportementales chutent aussi rapidement. Le partage de telles bases de données GET intégrées et de leurs interprétations avec un grand nombre de chercheurs et de sujets de recherche souligne la nécessité de modèles de consentement éclairé nécessaires à cette nouvelle protection des données personnelles et autres problématiques, en plus des besoins de flexibilité des ressources requises pour le partage des données, permettant en plus une utilisation peu restrictive de ces matériels et données. Cet article analyse les efforts du Projet du Génome Personnel afin de développer une base de données GET en tant que ressource génomique publique, largement accessible à la fois aux chercheurs et aux participants à la recherche, tout en respectant les standards les plus élevés de l'éthique de la recherche.

MeSH terms

  • Computational Biology / methods
  • Databases, Genetic / economics
  • Databases, Genetic / statistics & numerical data
  • Electronic Health Records / economics
  • Electronic Health Records / statistics & numerical data
  • Environment
  • Genetic Privacy*
  • Genome, Human / physiology*
  • Human Genome Project* / economics
  • Humans