РУБРИКИ |
Литература - Другое (книга по генетике) |
РЕКЛАМА |
|
Литература - Другое (книга по генетике)генома человека. Как правило, они распределены дисперсно по всем хромосомам, причем относительно короткие последователь- ности ДНК до 500 п.о., так называемые короткие диспергиро- ванные повторы - Sine, повторяются более 100 000 раз, в среднем, через каждые 2.2 кб. Число копий более длинных диспергированных последовательностей - Line, не превышает 10 000. Умеренные повторы найдены во всех структурных компонен- тах генома за исключением кодирующих областей генов. Два главных семейства умеренных повторов, Alu и Kpn1, занимают, по крайней мере, 10% генома и практически столько же занято несколькими сотнями других семейств повторов этого класса. Основной единицей Alu семейства является короткая последовательность из 300 п.о., повторенная в геноме челове- ка несколько сот тысяч раз, в среднем, через каждые 5 кб или через каждые 2 - 3 диспергированных повтора, принадлежащих другим семействам (Kao, 1985; Льюин, 1987). При этом, кластеры Alu-повторов, как правило, лежат внутри R-дисков метафазных хромосом - Гимза отрицательных (G- дисков). Расп- ределение Alu-повторов по геному весьма неравномерно как между хромосомами, так и по их длине. Так, в хромосомах 14, 16, 21 Alu-последовательности концентрируются в области центромеры, а в хромосомах 4, 19, 20, Х и У выраженные кластеры Alu повторов не найдены. Члены Alu семейства не полностью идентичны друг другу. Однако, все они содержат сайт рестрикции для фермента AluI и имеют димерную структу- ру, то есть состоят из двух прямых повторов длиной около 130 п.о. с богатой аденином вставкой из 31 нуклеотида во втором мономере. Каждая Alu последовательность фланкирована прямыми повторами длиной от 7 до 20 п.о., различными для разных чле- нов семейства и имеющими большую степень гомологии с транспозоноподобными элементами про- и эукариот. Некоторые члены Alu семейства могут транскрибироваться с помощью фер- мента РНК-полимеразы 111. Предпологается, что при определен- ных условиях образующиеся при этом молекулы РНК могут обрат- но транскрибироваться, что в свою очередь, может привести к появлению в клетках Alu-содержащих кДНК, обладающих свойствами ретропазонов, то есть способных инсертироваться в геномную ДНК. В литературе описаны случаи инсерционного му- тагенеза Alu повторов, приводящие к гемофилии В и нейрофиб- роматозу типа 1. Однако, частота таких событий, по-видимому, невелика. Предполагается, что короткие умеренные повторы, подобные Alu семейству, участвуют в регуляции транскрипции, в процессинге РНК и в инициации репликации ДНК. Кроме того, обнаружена высокая степень гомологии Alu последовательностей с одним из видов низкомолекулярной РНК (7 S РНК), участвую- щей в секреции белков. К числу Line повторов относится Kpn1 семейство, которое состоит из более длинных и значительно более гетерогенных последовательностей, рассеянных по всему геному. В ряде слу- чаев члены Kpn1 семейства группирются в кластеры, образуя более длинные структуры, повторяющиеся несколько тысяч раз. Для некоторых членов этого семейства также доказана возмож- ность инсерции кДНК-овых копий Kpn1- РНК-транскриптов в ге- номную ДНК и возникновение мутаций. Такое явление было обна- ружено в одном случае гемофилии А. Некоторые Kpn1- последо- вательности не только транскрибируются, но и способны транслироваться (Charlesworth et al.,1994). Раздел 2.3 Мультигенные семейства, псевдогены, онкоге- ны. Многие гены человека повторены в геноме от нескольких единиц до нескольких сотен раз и образуют мультигенные се- мейства (Газарян, Тарантул, 1983; Босток, Самнер, 1981; Kao, 1985; Льюин, 1987). Эти гены обычно сгруппированы в кластеры в определенных районах одной, либо нескольких хромосом. Во многих мультигенных семействах наряду с функционально актив- ными генами содержатся псевдогены - мутационно измененные последовательности, не способные транскрибироваться или про- дуцирующие функционально неактивный генный продукт. Примера- ми мультигенных семейств могут служить гены рибосомальных, транспортных и ядерных РНК, гены альфа- и бета-глобинов, ту- булинов, миоглобина, актина, интерферона и многих других. В ряде случаев, возможна избирательная амплификация некоторых семейств генов в процессе их экспрессии, как, например, ге- нов рибосомальных РНК. При этом число способных транскриби- роваться копий генов увеличивается за счет их избирательной амплификации в сотни и даже тысячи раз, что сопровождается лавинообразным нарастанием доли соответствующего генопродук- та в клетках. Особое место среди мультигенных семейств зани- мают супергены - очень большие кластеры из сотен функцио- нально и структурно родственных генов, расположенных в сег- ментах отдельных хромосом. Классическим примером супергена может служить HLA комплекс, контролируюший главные антигены гистосовместимости. Он занимает район более 6000 кб на ко- ротком плече хромосомы 6р21 и состоит из серии тесно сцеп- ленных генов, ответственных за синтез множества белков, включающих клеточные поверхностные антигены, молекулы иммун- ного ответа и некоторые компоненты комплемента. К суперген- ным семействам относятся три комлекса расположенных на раз- ных хромосомах мультигенов, контролирующих синтез тяжелых и легких цепей иммуноглобулинов. Интересно, что в процессе диффиренцировки B лимфоцитов, продуцирующих иммуноглобулины, происходит структурная перестройка этих семейств. При этом отдельные последовательности ДНК элиминируются, тогда как другие сливаются, так что структура генов иммуноглобулинов в зрелых B лимфоцитах значительно отличается от исходной, то есть от той, которая наблюдается в зародышевых клетках. Одной из важных структурных особенностей генома челове- ка является наличие так называемых псевдогенов, уникальных последовательностей, очень сходных по своей структуре с оп- ределенными нормальными генами, но в силу присутствия в ко- дирующих последовательностях целого ряда мутаций не способ- ных транскрибироваться или правильно транслироваться с обра- зованием структурно и функционально активного продукта. Псевдогены обнаружены для многих генов. Их количество варь- ирует от одной до нескольких десятков копий на геном и в этом случае они, как правило расположены тандемно. Иногда псевдогены тесно сцеплены с нормальными генами, во многих случаях псевдогены и гены локализованы в разных хромосомах. Для некоторых моногенных заболеваний идентифицированы му- тантные аллели, сходные с мутациями в соответствующих псев- догенах. В этих случаях обсуждаеся возможная роль псевдоге- нов в спнтанном мутационном процессе. В геноме человека присутствуют также нуклеотидные последовательности, гомологичные генам некоторых вирусов. Впервые эти последовательности были идентифицированы в гено- ме вирусов, индуцирующих развитие опухолей у животных и че- ловека, и потому они были названы онкогенами. Гомологичные последовательностям в геноме человека носят название прото- онкогенов. В настоящее время уже идентифицировано более 100 протоонкогенов. Белковые продукты протоонкогенов, по-видимо- му, играют важную роль в нормальной пролиферации клеток осо- бенно на ранних стадиях эмбрионального развития, контролируя клеточный цикл и выбор геномной программы развития клетки. При возникновении специфических мутаций в протоонкогенах, а также при нарушениях регуляции их работы, выражающихся в ги- перпродукции или в зкспрессии в нетипичномном месте или в несвойственный момент жизнедеятельности клетки, они начинают вести себя как онкогены, стимулируя неконтролируемое размно- жение и пролиферацию определенных клеточных клонов, что и может, в конечном счете, привести к формированию опухоли. Раздел 2.4 Современное определение понятия "ген", транскрипция, регуляторные элементы генов. Около 10-15% генома человека представлено уникальными транскрибируемыми последовательностями, составляющими основу структурных генов (Льюин, 1987). В настоящее время в понятие "ген" включается не только его транскрибируемая область - экзоны + интроны, но также фланкирующие последовательности - лидерная, предшествующая началу гена, и хвостовая нетрансли- руемая область, раположенная на 3' конце гена (Рис.2.1 ). В отличие от генов прокариот гены человека редко представлены одной непрерывной последовательностью и в подавляющем боль- шинстве имеют прерывистую структуру. Относительно короткие кодирующие участки - зкзоны, чередуются с длинными интрона- ми, которые транскрибируются и входят в состав первичного РНК-продукта, но затем при процессинге первичного РНК -транскрипта они вырезаются и не участвуют в трансляции. Процесс вырезания интронов из первичных транскриптов получил название сплайсинга. Таким образом, в зрелой мРНК интронные области отсутствуют, а экзоны составляют непрерывную кодиру- ющую последовательность. Размеры зрелых мРНК нередко в десятки раз меньше первичных РНК-транскрипов и, соот- ветственно, размеров самого гена. Согласно классическим представлениям ген - это локус, на хромосоме, мутации в котором реализуются на уровне фено- типа. В молекулярной биологии ген трактуется как ассоцииро- ванный с регуляторными последовательностями фрагмент ДНК, соответствующий определенной единице транскрипции. Следова- тельно, представления о гене формальных генетиков далеко не полностью тождественны его физической единице и соотношения между этими двумя понятиями достаточно запутанные. Отметим некоторые причины этих противоречий. Известно, что мутации одного гена могут приводить к совершенно разным и даже в ря- де случаев к комплементарным фенотипам. Результаты прямого секвенирования генома свидетельствуют о присутствии в нем значительного большего числа генов, чем можно ожидать от ре- зультатов мутационного анализа. Одна и та же последователь- ность ДНК в геноме может кодировать несколько различных бел- ков, что достигается за счет так называемого альтернативного сплайсинга (образование разных мРНК из одного первичного РНК-транскрипта). В крупных интронах ряда генов обнаружены смысловые последовательности других генов ("ген в гене"), считываемые в противоположном направлении. Транскрипционные единицы генома могут перекрываться за счет наличия разных промоторов. Наконец, благодаря соматической рекомбинации структура транскрибируемых последовательнстей некоторых ге- нов может быть различной в разных клонах клеток одного орга- низма (Т-клеточные рецепторы). Ситуация с определением поня- тия "ген" еще больше осложняется, если в это понятие вклю- чать многочисленные регуляторные последовательности. Возни- кает вопрос: "Как далеко от гена могут располагаться эти последовательности, чтобы их можно было включать в структуру гена?". Для многих целей оказывается удобным введенное в последнее время понятие "считаемый ген"- counting gene. Последний рассматривается как отдельная транскрибируемая единица ДНК или её часть, которая может транслироваться в одну или несколько взаимосвязанных аминокислотных последова- тельностей. Поэтому последовательность, дающая две транскрипционные единицы за счет альтернативного сплайсинга и, как следствие, два разных белка учитывается как один ген. Однако, если степень гомологии двух генопродуктов, имеющих общий транскрибируемый участок, невелика, то эти последова- тельности расцениваются как два разных гена (Fields et al.,1994). По своему функциональному назначению гены могут быть разделены на две группы. Группа I представлена генами, коди- рующими собственно белки; группа II - генами, контролирующи- ми синтез рибосомальных, транспортных и ядерных РНК. По ха- рактеру экспрессии гены также могут быть подразделены на две группы - гены "домашнего хозяйства" (housekeeping genes), продукты которых необходимы для обеспечения жизнедеятель- ности любого типа клеток, и тканеспецифические гены, обеспе- чивающие специализированные функции клеток, то есть гены, функционально активные только в определенных типах клеток (тканей) и только на определенных стадиях онтогенеза, так называемые гены терминальной дифференцировки. Считается, что средние размеры гена человека составля- ют, примерно, от 10 до 30 кб. Однако, эта величина может ко- лебаться от нескольких десятков до миллионов пар нуклеоти- дов. Согласно последним данным, самый маленький из известных генов- МСС-7, имеет размеры всего 21 п.о. (Gonzales-Pastor et al.,1994), а самый болшой - ген дистрофина -2.2 мегабаз. Гены отделены друг от друга протяженными промежутками - спейсерами, содержащими в своем составе большое количество повторяющихся последовательностей ДНК и нетранскрибируемые уникальные последовательности. Рассмотрим более подробно современные данные о числе генов в геноме человека. Полученные разными методами оценки этой величены приведены в Табл.2.1. Исходя из размера генома (около 3 000 миллионов п.о.), и среднего размера одного гена порядка 10 - 30 тыс.п.о. (Gilbert, 1992), общее число генов должно быть порядка 100 000. При этом, как уже указывалось, распределение генов на хромосомах крайне неравномерно. Уста- новлено, что более 90% генов находится в Гимза -отрицатель- ных районах метафазных хромосом, в так называемых R-бэндах (Antequera,Bird ,1993). Проведенные недавно прямые исследо- вания методом секвенирования показывают, что в R-бэндах их число достигает 43-50 на один бэнд, а в Гимза- положительных районах хромосом (G бэндах), - только 1-2 на 75-80 килобаз, то есть всего в геноме можно ожидать около 70 000 генов. Оценка числа генов по доле транскрибируемой части генома (всего 12%) дает совсем маленькую величину - 20 000 генов (Wagner et al.,1993). Методом исследования кинетики реассо- циации РНК в культуре клеток число генов оценивается между 20 - 40 000 (Lewin, 1990). В то же время в клетках мозга число различных мРНК по некоторым данным достигает 97 000 (Wagner et al.,1993). Наиболее точные подсчеты числа генов человека проведены в последнее время и основаны на оценке числа CpG островков (Табл.2.1). Известно, что в промоторной области всех генов "домашнего хозяйства" и примерно у 40 % генов терминальной дифференцировки, обеспечивающих специали- зированные функции дифференцированных клеток, находятся об- ласти коротких динуклеотидных CpG повторов. Разработаны мо- лекулярные методы точной регистрации этих участков, которые показали, что их число в геноме около 45 000, отсюда число структурных генов оценивается в 67-70 000 ( Antequera, Bird, 1993). Практически такое же число генов (64 000) определено недавно методом учета маркерных экспрессирующихся последова- тельностей (expressed sequence tags) (Fields et al., 1994). Таким образом, суммируя вышеизложенное, можно сделать вывод, что в геноме человека содержится, в среднем, около 70-80 000 отдельных транскрибируемых ДНК последовательностей, то есть генов. Транскрипция гена начинается с 5' конца первого экзона, где расположен сайт инициации транскрипциии. Определенной гомологии между стартовыми сайтами разных генов не наблюда- ется, но чаще всего они начинаются с нуклеотида А, окружен- ного пиримидиновыми основаниями. На границах между экзонами и интронами имеются консервативные канонические последова- тельности, играющие существенную роль в обеспечении точности вырезания интронов во время сплайсинга РНК. Все интронные последовательности начинаются с динуклеотида GT и заканчива- ются динуклеотидом AG, называемыми, соответственно, донорны- ми и акцепторными сайтами сплайсинга. На 3' конце многих структурных генов идентифицирована поли(А)-сигнальная после- довательность (AATAAA), участвующая в процессе модификации первичного РНК транскрипта и ответственная за альтернативный сплайсинг мРНК, обеспечивающий синтез разных зрелых мРНК с одного и того же первичного РНК транскрипта. Транскрипция генов осуществляется с помощью фермента РНК-полимеразы. Около 50-70% клеточного синтеза РНК обеспе- чивается РНК-полимеразой I, локализованной в ядрышках и от- ветственной за синтез генов рибосомальной РНК. РНК-полимера- за II обеспечивает транскрипцию генов, кодирующих собственно структурные белки. Этот фермент локализован в ядре (но не в ядрышках). На его долю приходится 20 - 40% синтеза РНК. РНК-полимераза III контролирует синтез ядерных и транспорт- ных РНК (Льюин, 1987). На 1-м этапе РНК-полимераза связыва- ется с двухнитевым участком ДНК и, расплетая его, делает доступным спаривание смысловой нити ДНК с рибонуклеотидами (Рис. 2.2). После того как первый нуклеотид РНК инкорпориру- ется в сайт инициации транскрипции, полимераза начинает продвигаться по нити ДНК в направлении 5'- 3', расплетая двойные нити ДНК впереди себя и заплетая их позади. Этот процесс продолжается до достижения терминирующего сигнала, представляющего собой один или несколько терминирующих кодо- нов. Затем молекулы РНК и фермента высвобождаются и двойная спираль (дуплекс) ДНК полностью восстанавливается. Для правильного начала синтеза РНК необходимо точное взаимодействие РНК-полимеразы с молекулой ДНК. Этот процесс контролируется промотором - специальной регуляторной после- довательностью ДНК размерами около 75 п.о., локализованной, как правило, в 5'-фланкирующей области гена. Иногда под контролем одного промотора считывается несколько генов c об- разованием единого первичного РНК-транскрипта. Промоторные области различных генов довольно разнообразны по своему нук- леотидному составу. Однако, почти для всех промоторов харак- терно наличие консервативной последовательности из 7 основа- ний на расстоянии 19-27 нуклеотидов слева от сайта инициации транскрипции. Это, так называемый, TATA -бокс (блок Хог- несса), обеспечивающий корректное расположение РНК полимера- зы по отношению к стартовому сайту. На расстоянии 70 - 80 п.о. в направлении 5'-конца от начала транскрипции часто расположена другая консервативная последовательность из 9 п.о. - CAAT- бокс, контролирующий начальное связывание РНК-полимеразы. Мутации в TATA- или в CAAT-боксах могут су- щественно влиять на скорость синтеза РНК. В 5'-фланкирующей области гена на расстоянии до тысячи пар оснований от начала его кодирующей части располагаются другие регуляторные последовательности, так называемые инхансеры (усилители), способные резко увеличивать продукцию гена за счет увеличе- ния скорости транскрипции. Эти контролирующие элементы могут работать независимо от их ориентации по отношению к сайту инициации. Для некоторых генов найдены участки ДНК, подавля- ющие транскрипцию, а также так называемые аттенюаторы (осла- бители) - последовательности, лежащие между сайтом инициации транскрипции и собственно геном. Они могут блокировать прод- вижение РНК-полимеразы. Благодаря такому сложному механизму контроля, достигается очень тонкая и эффективная регуляция экспрессии генов практически на всех этапах транскрипции, трансляции и образования функционально зрелого белка. Эти механизмы более детально рассмотрены в других разделах. Раздел 2.5 Изменчивость генома, полиморфные сайты рест- рикции, ПДРФ-анализ. Кодирующие и регуляторные области структурных генов на- иболее консервативны в процессе эволюции, так как мутации в них подвержены давлению жесткого естественного отбора. Действительно, небольшие изменения в этих последователь- ностях, даже замена одного основания, делеция или инсерция нескольких нуклеотидов, могут привести к прекращению синтеза белка или к потере его функции, что, как правило, драмати- ческим образом сказывается на жизнеспособности особей, несу- щих подобные мутации. Однако, около 90% генома человека состоит из некодирующих последовательностей, подобных сател- литным ДНК, умеренным повторам, интронам и спейсерным проме- жуткам между генами. Эти участки значительно более изменчивы и содержат множество, так называемых нейтральных мутаций или полиморфизмов, не имеющих фенотипического выражения и не оказывающих заметного влияния на жизнеспособность или репро- дуктивные свойства особей и, таким образом, не подверженных прямому давлению естественного отбора. Полиморфные локусы являются удобными генетическими маркерами. На основе анализа родословных можно проследить их наследование в ряду поколе- ний, проанализировать сцепление друг с другом, с известными генами и с анонимными последовательностями ДНК, то есть использовать в качестве обычных менделевских признаков в классическом генетическом анализе. Информативность полиморф- ных локусов определяется уровнем их генетической изменчи- вости в различных популяциях. Экспериментально легко выявляются два варианта геномно- го полиморфизма. Количественые изменения в области локализа- ции мини- и микросателлитных последовательностей ДНК и ка- чественные замены отдельных нуклеотидов, приводящие к появ- лению полиморфных сайтов рестрикции. В первом случае измен- чивость по числу повторенных "коровых " единиц создает серию аллелей, характер и частота которых уникальны для каждого вариабильного локуса. Полиморфизм в сайтах рестрикции связан с присутствием точковых нейтральных мутаций, локализованых, как правило, в уникальных последовательностях некодирующих участков ДНК. Подобные мутации в силу вырожденности генети- ческого кода (см.Глава 1) могут возникать и в кодирующих последовательностях генов. Спонтанные мутации, возникающие в сайтах узнавания для определенных рестриктаз, делают их ре- зистентными к действию этих ферментов. Аналогичным образом, при таких заменах могут создаваться новые сайты рестрикции. Показано, что полиморфные локусы встречаются во всех хро- мосомах с частотой приблизительно один полиморфный сайт на 300-500 п.о. Этот тип изменчивости ДНК был выявлен и исполь- зован для молекулярной маркировки специфических участков ге- нома исторически раньше по сравнению с вариабильными сател- литными повторами (Botstein et al.,1980). Мутационная изменчивость в сайтах рестрикции может быть легко обнаружена по изменению длины рестрикционных фрагмен- тов ДНК, гибридизующихся со специфическими ДНК-зондами. Ана- лиз полиморфизма длины рестрикционных фрагментов, так назы- ваемый ПДРФ-анализ (Restriction Fragment Length Polymorphism -RFLP analysis), включает следующие этапы: выделение геном- ной ДНК, ее рестрикцию специфической эндонуклеазой, элекро- форетическое разделение образующихся фрагментов ДНК и иден- тификацию фрагментов ДНК, содержащих полиморфный сайт рест- рикции, путем блот-гибридизации по Саузерну (см.Главу 1). При отсутствии рестрикции в полиморфном сайте на электрофо- реграммах или радиоавтографах (в зависимости от типа мечения ДНК-зонда) будет выявляться один крупный фрагмент, соот- ветствующий по длине последовательности ДНК между двумя соседними константными сайтами рестрикции для той же эндо- нуклеазы. При наличии рестрикции в полиморфном локусе на электрофореграмме будет присутствовать меньший по размерам фрагмент, равный расстоянию между полиморфным сайтом рест- рикции и одним из ближайших константных сайтов рестрикции. С каким именно из двух фрагментов, прилегающих к полиморфному локусу, будет происходить гибридизация зависит от локализа- ции используемого для анализа ДНК-зонда. В частном случае возможна гибридизация одновременно с двумя соседними рест- рикционными фрагментами, если выбранный ДНК-зонд комплемен- тарен последовательности, содержащей полиморфный сайт рест- рикци. Однако, такие зонды очень редко используются на прак- тике, так как длина рестрикционных фрагментов обычно в десятки раз больше длины ДНК-зондов и далеко не всегда уда- ется выделить и проклонировать фрагмент ДНК, содержащий по- лиморфный сайт рестрикции. Поэтому в дальнейшем для простоты изложения мы будем рассматривать только более общую ситуацию и считать, что при отсутствии рестрикции в полиморфном сайте ДНК-зонд гибридизуется с одним длинным фрагментом, а при на- личии рестрикции гибридизующийся фрагмент имеет меньшую дли- ну. Таким образом, при анализе ДНК особей, в обеих хромосо- мах которых присутствует сайт рестрикции в полиморфной об- ласти, на электрофореграмме будет выявлен только один бэнд в нижней области геля, соответствующий более короткому фраг- менту ДНК. У особей, гомозиготных по мутации, изменяющей по- лиморфный сайт рестрикции, будет наблюдаться один бэнд в верхней части геля, соответствующий фрагменту большей длины, тогда как у гетерозигот проявятся оба эти бэнда (Рис. 2.3а). ПДРФ-анализ может быть значительно упрощен в том случае, если возможна специфическая амплификация участка ДНК, содер- жащего полиморфный сайт рестрикции. Тестирование состояния этого локуса возможно путем проведения ПЦР и рестрикции амп- лифицированного фрагмента. При отсутствии сайта узнавания в исследуемой области ДНК размеры амплифицированного фрагмента не изменятся после его обработки соответствующей эндонуклеа- зой, тогда как при полном соответствии полиморфной области сайту рестрикции образуются два фрагмента меньшей длины (Рис.2.3б). У гетерозигот будут присутствовать 3 фрагмента, один из которых по длине будет соответствовать размеру амп- лификата до рестрикции, плюс 2 маленьких фрагмента с той же суммарной длиной. Таким образом, как и в случае использова- ния для анализа блот гибридизации по Саузерну, трем возмож- ным вариантам генотипа будут соответствовать три различных варианта электрофореграмм. Необходимо подчеркнуть, что первичная идентификация по- лиморфных сайтов рестрикции, сцепленных с определенными ге- нами, возможна только при наличии соответствующих ДНК-зон- дов. Дальнейшая тактика заключается в поиске рестрикционной нуклеазы, выявляющей полиморфизм. С этой целью используют широкий набор эндонуклеаз для рестрикции геномной ДНК, выде- ленной из группы неродственных индивидуумов, представляющих собой репрезентативную выборку популяции. Затем проводят ПДРФ-анализ отдельно для каждой из рестриктаз с набором име- ющихся ДНК-зондов. После обнаружения полиморфизма в одной из популяций аналогичные исследования проводят в других популя- циях. Следует учитывать, что полиморфные сайты рестрикции всегда представляют собой двухаллельную систему, поэтому да- же при самой высокой вариабильности такого сайта, число ге- терозиготных по данному локусу особей в популяции не будет превышать 50% Между тем, только при наличии полиморфного сайта в гетерозиготном состоянии можно отличить мутантный аллель от нормального, то есть осуществить его молекулярную маркировку. Следовательно, информационная емкость такого по- лиморфизма относительно невелика ( см. Главы Y и VII). Раздел 2.6 Вариабильные микро- и минисателлитные ДНК. Гипервариабильные сателлитные повторы являются гораздо более информтивными маркерами по сравнению с полиморфными сайтами рестрикции, так как представляют собой мультиаллель- ные системы с уровнем гетерозиготности, достигающим 70 - 90%. Кроме того, оказалось, что количество высокоизменчивых микрои минисателлитных последовательностей в геноме челове- ка, по-видимому, превышает несколько десятков тысяч, они достаточно плотно и равномерно расположены в каждой из хро- мосом. Так более 90% из 5000 идентифицированных (C-A)-повто- ров являются полиморфными, причем в большинстве из них уро- вень гетерозиготности значительно превышает 50% (Weissenbach et al, 1992). Среди гипервариабильных мини-сателлитных последовательностей различают варьирующие по числу тандемные повторы - VNTR, три-, тетра- и пентануклеотидные повторы, а также некоторые другие классы повторов. Общее число высоко- полиморфных минисателлитных последовательностей в геноме превышает 1500 (Armour et al., 1990; Charlesworth et al., 1994). VNTR (variable number tandem repeats - варьирующие по числу тандемные повторы) -характеризуются наличием 10 - 15 - ти нуклеотидных "коровых" последовательностей, сходных с контролирующими элементами рекомбинации E.coli (Jeffreys et al., 1985). С помощью ДНК-зондов, сконструированных на осно- ве тандемно повторяющихся "коровых" последовательностей, можно анализировать индивидуальную изменчивость в единичных или множественных высокополиморфных локусах, несущих одно- типную коровую последовательность. Примером может служить VNTR, обнаруженная в интроне миоглобинового гена, включающая четыре тандемных повтора из 33 п.о., фланкированных прямыми повторами из 9 п.о. Полученные из этого района ДНК-зонды с успехом используются для идентификации личности методом ДНК-фингерпринта, так как вероятность совпадения аллелей у двух неродственных индивидуумов по всем гипервариабильным локусам, гибридизующихися с этим ДНК-зондом, значительно меньше 10!-7 (Jeffreys et al.,1991). Высокополиморфные VNTR найдены также в гене инсулина, в области глобинового псевдо- гена и в Х-хромосоме, содержащей последовательности, гомоло- гичные ДНК вируса гепатита В (Nakamura et al., 1985). В последнее время многочисленные VNTR- последовательности об- наружены в хромосомах 1, 2q, 14, 16, 17, 19 (O'Brien,1992). Поиск новых гипервариабильных локусов основан на системати- ческом скрининге клонированных последовательностей ДНК с по- мощью искусственно синтезированных "коровых" зондов. Особен- но удобны для такого скрининга геномные библиотеки, сконструированные на основе предварительно фракционированных по величине Mbo1 или Sau3A1 фрагментов ДНК, так как большие фрагменты обогащены длинными и более вариабильными минисате- литными последовательностями (Armour, et al., 1990). Хорошие результаты были получены также при скринировании космидных библиотек с помощью G-богатых синтетических ДНК-зондов и использование хемолюминесцентного метода в сочетании с ПЦР (Decorte, Cassiman, 1990). В некоторых случаях с этой целью применяют также последовательности ДНК, выделенные из фага М13, имеющего в своем составе сходные структуры (Armour etal., 1990). Одним из вариантов минисателлитных последовательностей являются тримерные и тетрамерные короткие тандемные повторы -STR (short tandem repeats), которые стабильно наследуются и также обладают высоким уровнем полиморфизма по числу коровых единиц (Edwards et al., 1991). В X хромосоме такие повторы обнаружены через каждые 300 - 500 кб, тогда как в других частях генома они встречаются на расстоянии 10 кб друг от друга. По некоторым оценкам их частота может достигать 1/20 кб (Charlesworth et al.,1994). Возможно, истиное число три- и тетрамерных повторов в геноме человека еще больше, так как они обнаружены во многих генах. Подобно другим повторам STR обычно встречаются в некодирующих частях генов. В последнее время, однако, обнаружена группа структурных генов, несущих тримерные повторы в регуляторных и даже в транслируемых частях генов. Изменения числа этих внутригенных повторов в сторону их увеличения может приводить к нарушению функции этих генов вплоть до полного блока экспрессии и быть причи- ной ряда тяжелых наследственных заболеваний - болезни экспансии (см.Главу X). В качестве зондов для выявления ко- ротких тандемных повторов используют синтетические олигонук- леотиды, построенные из простых повторов трех или четырех нуклеотидов. В последнее время для обнаружения различных классов микросателлитных последовательностей и STR-повторов применя- ют эффективные методы, основанные на использовании ПЦР (Edwards et al., 1991). Для этих локусов характерно большое число аллелей, которые различаются по числу коровых единиц. Продукты амплификации этих сайтов могут отличаться друг от друга числом ди- три- или тетрануклеотидных повторов. Для удобства идентификации различных аллелей полимеразную цепную реакцию проводят в присутствии меченых нуклеотидов, а для электрофоретического разделения продуктов амплификации используют специальные секвенирующие гели. Многие STR-локусы настолько полиморфны, что нашли применение в судебной меди- цине для идентификации личности. Для повышения достоверности результатов с этой целью используют мультиплексные варианты ПЦР, позволяющие устанавливать генотип индивидуума одновре- менно по нескольким STR-сайтам (Weber,May, 1994; Асеев и др.,1995). Возможность точного генотипирования личности с использованием полимеразной цепной реакции, то есть на мини- мальном количестве ДНК, является важным методическим преиму- ществом STR перед ранее рассмотренными VNTR, для анализа ко- торых чаще используют блот-гибридизацию по Саузерну. Высокая частота коротких тандемных повторов, уникаль- ность комбинаций числа тетра-, три- и димеров в разных сай- тах в сочетании с их большой вариабильностью и сравнительной легкостью идентификации аллелей позволяет широко использо- вать эти повторы для генетического и физического картирова- ния в качестве наиболее удобных индексных маркеров геномных ДНК-последовательностей (см.Главу III). Такие маркерные сай- ты получили название STS (sequence tagged sites). В настоя- щее время в геноме человека уже идентифицировано около 10 000 STS, подавляющее большинство которых представляет собой тандемные повторы 2 - 4 нуклеотидов. Благодаря выраженной индивидуальной специфичности и достаточно стабильному менде- левскому типу наследования STS-сайты нашли широкое примене- ние и в молекулярной диагностике генных болезней, прежде всего в качестве молекулярных маркеров для идентификации му- тантных хромосом в семьях высокого риска (см. Главу VII). Наличие большого числа гипервариабильных микро- и минисател- литных последовательностей ДНК является характерной особен- ностью генома человека. Аналогичные последовательности, об- наруженные в геноме приматов, значительно более однородны, что доказывает возможность существенного увеличения вариа- бильности этих участков ДНК за сравнительно короткий эволю- ционный промежуток (Юров,1988; Gray et al., 1991). Сведения о мутабильности высокополиморфных последова- тельностей в геноме человека весьма противоречивы. Показано, однако, что в наиболее вариабильных минисателлитных локусах частота мутаций может достигать 5% на гамету (Jeffreys et al., 1988). Предполагается, что одной из главных функций ги- первариабильных микро- и минисателлитных последовательностей ДНК может быть контроль гомологичной рекомбинации в мейозе. На культурах клеток показано стимулирующее влияние миниса- теллитных последовательностей ДНК на гомологичную рекомбина- цию. Так, инсерция синтезированной последовательности, составленной на основе гипервариабильных минисателлитов в геномную ДНК приводит к более, чем 10-кратному увеличению числа реципрокных обменов, причем степень этого влияния об- ратно пропорциональна расстоянию между STR и сайтом рекомби- нации (Wahls et al., 1990). Вместе с тем, многие авторы об- ращают внимание на достаточно высокую стабильность миниса- теллитных аллелей, что позволяет их широко использовать как для генетического маркирования, так и для популяционных исследований и идентификации личности методом ДНК-фингерп- ринта (Decorte,Cassiman 1993; Edwards et al.,1991; Ива- нов,1989). Для многих мутаций, локализованных в некодирующих частях генома, характерны высокие уровни популяционного по- лиморфизма. Необходимо, однако, подчеркнуть, что эта измен- чивость не затрагивает общей структуры генома, определяющей различия между видами. Более того, сопосталение первичных нуклеотидных последовательностей сравнительно протяженных секвенированных участков ДНК (области Т-рецепторных генов длиной около 100 кб) обнаружило сохранение высокой степени гомологии не только в кодирующих, но и, что особенно удиви- тельно, в некодирующих частях этих последовательностей. Если учесть, что эволюционно человек и мышь разделены почти 80 миллионами лет эволюции, эти данные рассматриваются как сви- детельство функциональной значимости некодирующих частей этих генов По-видимому, далеко не всякие мутации в некодиру- ющих районах ДНК являются нейтральными и в определенных слу- чаях они могут отрицательно влиять на жизнеспособность. К сожалению, в настоящее время ничего или почти ничего неиз- вестно о функциях некодирующих ДНК-последовательностей. Высказывалось даже предположение, что их единственной функ- цией является репликация. Отсюда возникло представление об "эгоистической" или "паразитической" ДНК. Конечно, полностью исключить наличие подобных паразитических последователь- ностей ДНК в любом геноме нельзя. Тем ни менее, представля- ется маловероятным, что значительная часть генома человека, также как и других видов, относится к эгоистической ДНК. По-видимому, наши знания о роли некодирующей или, как еще говорят, "избыточной" ДНК все еще явно недостаточны. Ста- бильность структурной организации генома в пределах вида свидетельствует скорее о важной эволюционной роли некодирую- щих ДНК-последовательностей и об их участии в процессах он- тогенеза. Можно предполагать, что ответ на этот интригующий вопрос в какой-то мере будет получен при расшифровке и срав- нении полной первичной нуклеотидной последовательности гено- мов у животных разных видов и, прежде всего, у человека и мыши, где прогресс в секвенировании геномной ДНК особенно значителен (см.Главу III). Уместно заметить, что проведенный недавно компьютерный анализ генома человека позволяет пред- полагать наличие в его некодирующей части особого, пока еще непонятного генетического кода, смысл и значение которого остаются загадочными ( ?). Раздел 2.7 Мобильность генома, облигатные и факульта- тивные элементы генома. До сих пор мы рассматривали основные структурные эле- менты генома человека, положение которых в соответствии с представлениями классической генетики достаточно постоянно. Начиная с 50-х годов стали накапливаться данные о существо- вании большого числа мобильных генетических элементов, присутствие которых в геноме не является обязательным, а их топография и количество может варьировать в различных клет- ках, тканях и у разных индивидуумов (McClintock, 1984; Berg, Howe, 1989). У прокариот такие элементы получили название транспозонов. Их структура и функции достаточно хорошо изу- |
|
© 2007 |
|