The Protein Data Bank (PDB), created in 1971 when merely seven protein crystal structures were known, today holds over 120, 000 experimentally-determined three-dimensional models of macromolecules, including gigantic structures comprised of hundreds of thousands of atoms, such as ribosomes and viruses. Most of the deposits come from X-ray crystallography experiments, with important contributions also made by NMR spectroscopy and, recently, by the fast growing Cryo-Electron Microscopy. Although the determination of a macromolecular crystal structure is now facilitated by advanced experimental tools and by sophisticated software, it is still a highly complicated research process requiring specialized training, skill, experience and a bit of luck. Understanding the plethora of structural information provided by the PDB requires that its users (consumers) have at least a rudimentary initiation. This is the purpose of this educational overview.
Bank Struktur Białkowych (Protein Data Bank, PDB), utworzony w 1971, gdy znano zaledwie 7 struktur białek, dziś zawiera ponad 120 tys. wyznaczonych doświadczalnie trójwymiarowych modeli makromolekuł biologicznych, w tym takich gigantów jak wirusy i rybosomy złożone z setek tysięcy atomów. Większość zdeponowanych w PDB struktur pochodzi z krystalografii rentgenowskiej, choć z postępem metodologii swój udział zaznaczyła spektroskopia NMR oraz - obecnie - kriomikroskopia elektronowa. Mimo że wyznaczanie struktury makromolekuł zostało z czasem ułatwione przez niewyobrażalny postęp techniki i metod obliczeniowych, jest ono nadal skomplikowanym procesem badawczym, wymagającym solidnego wyszkolenia, doświadczenia i talentu. Podobnie zrozumienie astronomicznej ilości danych zgromadzonych w PDB i przełożenie ich na wiedzę - wymaga dobrego przygotowania. Wstępem do niego może być niniejszy artykuł.
Keywords: Protein Data Bank; data mining; macromolecular structure; structural biology; structural databases; structure validation.