Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

MOLECULAR ANALYSIS OF GENES ASSEMBLY THE CHLAMYDIAL STRAIN PP-87, ADJACENT TO PROS-GENE ENCODING PROLYL-TRNA-SYNTHETASE

Karimov M.Z. 1 Bakirov I.K. 1 Vafin R.R. 1 Ravilov R.K. 1 Tyulkin S.V. 2 Kabilov M.R. 3 Zaynullin L.I. 4 Akhmetov T.M. 1
1 Kazan state academy of veterinary medicine
2 Tatar trans-regional veterinarian laboratory
3 SB RAS «Genomics» Core Facility
4 Kazan (Volga Region) Federal University
The aim of this study was a molecular genetic analysis of genes assembly the chlamydial strain PP-87, adjacent to proS-gene encoding prolyl-tRNA-synthetase, on the full genome sequencing database. The study found that, despite general genomic similarity strain Chlamydia sp. PP-87 to the reference genome of a strain of Chlamydia psittaci GR9, for a number of genes, for example encoding cold and heat shock proteins adjacent to proS, it exhibits similarity to the most closely related strain of Chlamydia abortus S26/3. The genes encoding cold and heat shock proteins, as well as other nearby genes to them (including proS-gene) strain PP-87 is the key as to the disclosure of molecular mechanisms of development of infection process with the justification of the pathogenesis of chlamydial infection associated with placental colonization of the host by intracellular parasite, and to clarify the evolution of chlamydia.
chlamydia
genes assembly
cold and heat shock proteins
sequencing
1. Vafin R.R. A contribution to the nomenclature and classification of chlamydiae / R.R. Vafin, R.Kh. Ravilov, Kh.Z. Gaffarov, A.Z. Ravilov, G.M. Iskhakov, I.Kh. Bakirov, V.N. Kashov, R.R. Vafin // Mol. Gen. Mikrobiol. Virusol. 2007. no. 4. рр. 17–25.
2. Ravilov, R.Kh. Chlamydial strain Chlamydia psittaci, used for manufacture of biological products for the diagnosis and prevention of chlamydiosis in arctic foxes: certificate of authorship no. 1667869 / R.Kh. Ravilov, R.A. Shafikova, A.Z. Ravilov, A.Yu. Bekleshova // publication 07.08.1991.
3. Vafin, R.R. On the nomenclature and classification of chlamydiae / Vafin, R.Kh. Ravilov, Kh.Z. Gaffarov, A.Z. Ravilov, G.M. Iskhakov, I.Kh. Bakirov, V.N. Kashov // Molecular Genetics, Microbiology and Virology. 2007. Vol. 22. no. 4. pp. 155–164.
4. Van Lent S. Full genome sequences of all nine Chlamydia psittaci genotype reference strains / S. Van Lent., J.R. Piet, D. Beeckman, A. van der Ende, F. Van Nieuwerburgh, P. Bavoil, G. Myers, D. Vanrompay, Y. Pannekoek // J. Bacteriol. 2012. Vol. 194. no. 24. pp. 930–6931.
5. Van Loock M. Missing links in the divergence of Chlamydophila abortus from Chlamydophila psittaci / M. Van Loock, D. Vanrompay, B. Herrmann, J. Vander Stappen, G. Volckaert, B.M. Goddeeris, K.D. Everett // Int. J. Syst. Evol. Microbiol. 2003. Vol. 53. no. 3. pp. 761–770.

Факты существования штаммов хламидий, занимающих промежуточное положение между видами Chlamydia psittaci и Chlamydia abortus, включая проблемы таксономического соотнесения так называемых «промежуточных» штаммов и пути решения вопросов их видовой принадлежности, изложены в научных публикациях [1, 3, 5].

Геномы хламидий являются перспективным объектом исследования [4], тем более учитывая то обстоятельство, что генетический критерий идентификации служит одним из конструктивных звеньев построения их таксономической классификации [1, 3].

Методы полногеномного секвенирования на высокопроизводительных секвенаторах нового поколения, приобретающие статус рутинных генодиагностических исследований, являются ценным мультизадачным инструментарием, в т.ч. способствующим раскрытию молекулярных механизмов патогенеза изучаемого инфекционного агента.

Цель настоящей работы – молекулярно-генетический анализ ассамблеи генов штамма хламидий ПП-87 [2], близлежащих к proS-гену, кодирующему пролил-тРНК-синтетазу, на основе полученных массивов данных полногеномного секвенирования.

Материалы и методы исследования

Экстракция геномной ДНК штамма хламидий ПП-87, выделенного от абортировавшей самки песца [2] и адаптированного к размножению в желточных оболочках куриных эмбрионов, осуществлена набором «ДНК-сорб Б» («ЦНИИ эпидемиологии», Россия).

Создание фрагментной библиотеки выполнено с помощью набора NEBNext DNA Library (NEB, США), где на начальном этапе проводилась фрагментация геномной ДНК с помощью ультразвука на приборе Covaris S2 (Covaris, США). Далее полученные фрагменты обрабатывались Т4 ДНК-полимеразой для получения «тупых» концов и Т4 полинуклеотидкиназой для присоединения фосфата на 5’-конец. На следующем этапе в реакционную смесь был добавлен фрагмент Кленова для присоединения dА на 3’-конец, что позволило провести дальнейшее селективное присоединение к полученным фрагментам с помощью ДНК-лигазы двуцепочечного адаптера, несущего в своей последовательности участки для проведения полимеразной цепной реакции (ПЦР) и секвенирования. На последнем этапе проводилась ПЦР для увеличения копийности фрагментов, а также для избавления от концевых некомплементарных участков.

Качество полученной фрагментной библиотеки оценивали с помощью набора High Sensitivity DNA Kit на приборе Bioanalyzer 2100 (Agilent, США). Количество ДНК было определено с помощью набора dsDNA High Sensitivity Kit на флюориметре Qubit 1.0 (Invitrogene, США). Секвенирование фрагментной библиотеки на геномном секвенаторе MiSeq (Illumina, США) проводилось по протоколу производителя с использованием набора MiSeq Reagent Kit, 600 Cycles (Illumina, США) в ЦКП «Геномика» СО РАН (Новосибирск).

Результаты исследования и их обсуждение

В результате секвенирования были получены парные чтения (Paired End), т.е. каждый фрагмент был прочитан с двух сторон 300 + 300 нт. Общий объем полученных данных для библиотеки составил порядка 660 тыс. последовательностей или 167 Мб, что должно было обеспечить более чем 150-кратное покрытие генома хламидий. Более 80 % полученных последовательностей имели качество QV > 30 (Phred Quality Score), что соответствует наличию всего лишь 0,1 % ошибок, т.е. 1 на 1000 нуклеотидов.

Для дальнейшего анализа полученные последовательности были отфильтрованы по качеству (QV > 20), оттриммированы и картированы на геном Chlamydia psittaci GR9. Количество ридов, соответствовавших этому геному, составило 1,6 % (10 600) от общего количества, Покрытие генома в среднем составило 2 ± 1,86, и 25 % генома при этом было с нулевым покрытием. Причиной низкого покрытия генома хламидий послужило присутствие ДНК Gallus Gallus, составившей основную часть просеквенированного материала.

Однако, несмотря на крайне низкое покрытие генома, был проведен анализ полиморфизмов, для которых покрытие было не меньше 4. Их оказалось 66 шт., из них 20 приводило к несинонимичным заменам в таких генах, как polA (DNA polymerase I), proS (prolyl-tRNA synthetase), dapL (LL-diaminopimelate aminotransferase), mhcA3 (myosin heavy chain-like domain protein) и др. Следует обратить внимание, что максимальное количество SNV наблюдается в генах двух белков: vacB and RNase II 3/-5/ exoribonucleases family protein и proS. Причем в последнем мутации приводят к 5 заменам аминокислот.

Данные 5 аминокислотных замен, выделенных серым цветом, а также подчеркнутая аминокислотная последовательность, транслированная с секвенированной нуклеотидной последовательности штамма ПП-87 с покрытием не менее 4, представлены на рис. 1.

pic_62.tif

Рис. 1. Выравнивание аминокислотных последовательностей пептидного фрагмента prolyl-tRNA synthetase штаммов Chlamydia sp. ПП-87 (Query), Chlamydia abortus S26/3 (CR848038) и Chlamydia psittaci GR9 (CP003791)

Соответствующие выравненные нуклеотидные последовательности локуса proS-гена, кодирующие пептидный фрагмент prolyl-tRNA synthetase этих же штаммов хламидий, представлены на рис. 2.

pic_63.tif

Рис. 2. Выравнивание нуклеотидных последовательностей локуса proS-гена штаммов Chlamydia sp. ПП-87 (Query), Chlamydia abortus S26/3 (CR848038) и Chlamydia psittaci GR9 (CP003791). Примечания: подчеркнутым выделены нуклеотидные последовательности с покрытием генома не менее 4, серым цветом выделены нуклеотиды, ассоциированные с несинонимическими нуклеотидными заменами, приводящими к замене аминокислоты

Локусы генов, близлежащих к proS, также были проанализированы на предмет гетерогенности/идентичности (табл. 1 и 2 соответственно) штамма ПП-87 к штаммам GR9 и S26/3 и представлены в обобщенной (табл. 1) и развернутой (табл. 2) формах.

Таблица 1

Анализ гетерогенности штамма Chlamydia sp. ПП-87 к штаммам Chlamydia psittaci GR9 и Chlamydia abortus S26/3 в процентном выражении близлежащих локусов генов

GR9

0 %

5 %

4 %

6–9 %

5–8 %

6–8 %

7 %

7–8 %

10 %

0 %

0 %

0 %

ПП-87

CBS

vacB

dnaK

grpE

hrcA

proS

ABC

dapL

SSFP

PIMP

aroG

PMP

S26/3

9 %

1 %

1 %

1 %

2–3 %

1–3 %

1 %

1 %

2 %

3 %

7–10 %

10 %

Обозначения кодируемых белков: CBS – CBS domain pair family protein; vacB – vacB and RNase II 3/-5/ exoribonucleases family protein; dnaK – heat shock chaperone protein (hsp70); grpE – GrpE protein (hsp-70 cofactor); hrcA – heat-inducible transcription repressor: proS – prolyl-tRNA synthetase; ABC – ABC transporter substrate binding family protein; dapL – LL-diaminopimelate aminotransferase; SSFP – solute symporter family protein; PIMP – putative inner membrane protein; aroG – phospho-2-dehydro-3-deoxyheptonate aldolase; PMP – putative membrane protein.

Примечательно, что, несмотря на общегеномное сходство штамма Chlamydia sp. ПП-87 к референсному геному штамма Chlamydia psittaci GR9, по ряду генов, например кодирующих белки холодового и теплового шока, близлежащих к proS, он проявляет наиболее близкородственное сходство к штамму Chlamydia abortus S26/3.

Таблица 2

Анализ идентичности штамма Chlamydia sp. ПП-87 к штаммам Chlamydia psittaci GR9 и Chlamydia abortus S26/3 в процентном выражении близлежащих локусов генов

Chlamydia psittaci GR9 (GenBank A/N: CP003791)

Chlamydia sp. ПП-87

Chlamydia abortus S26/3 (GenBank A/N: CR848038)

1

2

3

4

complement (250164...251288) /product = «CBS domain pair family protein»

(250672–251041)

100 %

(251242–252193)

100 %

(250554–250923)

91 %

(251124–252075)

93 %

complement(250046...251170)

/product = «CBS domain pair family protein»

complement (251290...251766)

complement (251768...251929)

complement (251964...252089)

/product = «hypothetical protein»

complement(251172...251648)

complement(251667...251828)

complement(251846...252007)

/product = «hypothetical protein»

complement (252243...252908)

/product = «hypothetical protein»

(252356–252622)

100 %

(252238–252504)

95 %

complement(252146...252790)

/product = «putative exported protein»

complement (253664...255709)

/product = «vacB and RNase II 3/-5/ exoribonucleases family protein»

(254041–254677)

95 %

(253920–254556)

99 %

complement (253543...255591)

/product = «vacB and RNase II 3/-5/ exoribonucleases family protein»

complement (255866...257845)

/gene = «dnaK»

/product = «chaperone protein DnaK»

(256083–256683)

96 %

(257277–257713)

95 %

(255962–256562)

99 %

(257156–257592)

99 %

complement (255745...257724)

/gene = «dnaK»

/product = «heat shock chaperone protein» (hsp70)

complement (257871...258446)

/gene = «grpE»

/product = «grpE family protein»

(257864–258022)

91 %

(258169–258435)

94 %

(257743–257901)

99 %

(258048–258314)

99 %

complement (257750...258325)

/gene = «grpE»

/product = «GrpE protein(hsp-70 cofactor)»

complement (258443..259603)

/gene = «hrcA»

/product = «heat-inducible transcription repressor HrcA»

(258683–258902)

95 %

(258951–259483)

92 %

(258562–258781)

97 %

(258830–259362)

98 %

complement (258322...259482)

/gene = «hrcA»

/product = «heat-inducible transcription repressor»

complement (259712...261445)

/gene = «proS»

/product = «prolyl-tRNA synthetase»

(259644–259915)

94 %

(259935–260167)

94 %

(260250–260767)

91 %

(260772–261028)

93 %

(261060–261436)

92 %

(259523–259794)

99 %

(259814–260046)

97 %

(260129–260646)

99 %

(260651–260907)

98 %

(260939–261315)

99 %

complement (259591...261324)

/gene = «proS»

/product = «prolyl-tRNA synthetase»

261710...262906

/product = «hypothetical protein»

(262707–262892)

91 %

(262587–262772)

98 %

261590...262786

/product = «hypothetical protein»

263962...264240

/product = «hypothetical protein»

(263967–264183)

94 %

(263847–264063)

99 %

263842...264132

/product = «hypothetical protein»

complement (264237...265280)

/product = «ABC transporter substrate binding family protein»

(264548–264815)

93 %

(264950–265779)

93 %

(266031–266458)

92 %

(264380–264695)

99 %

(264830–265659)

99 %

(265911–266338)

99 %

complement (264117...265160)

/product = «putative exported protein»

complement (265277...266473)

/gene = «dapL»

/product = «LL-diaminopimelate aminotransferase»

complement (265157...266353)

/gene = «dapL»

/product = «putative aminotransferase»

1

2

3

4

266738...267508

/product = «hypothetical protein»

(266815-267294)

84 %

(266697–267174)

97 %

266618...267382

/product = «hypothetical protein»

267942...269177

/product = «hypothetical protein»

(267588–268109)

95 %

(268569–268755)

93 %

(268764–268895)

92 %

(269136–269471)

93 %

(269500–269953)

91 %

(270266–270499)

94 %

(270446–271493)

96 %

(271537–271889)

95 %

(267462–267984)

99 %

(268444–268630)

99 %

(268639–268770)

98 %

(269011–269349)

99 %

(269375–269828)

98 %

(270141–270374)

99 %

(270560–271367)

99 %

(271411–271763)

99 %

(272073–272219)

97 %

272281–272574)

97 %

(272705–273084)

99 %

(273179–273525)

98 %

(273785–274081)

99 %

267808...269052

/product = «putative exported protein»

complement(269178..271262)

/product = «hypothetical protein»

complement (269053...271137)

/product = «hypothetical protein»

271402...272007

/product = «hypothetical protein»

271285...272154

/product = «hypothetical protein»

271983...272279

/product = «hypothetical protein»

(272198–272344)

91 %

272151...272483

/product = «hypothetical protein»

272276...272608

/product = «HIT domain protein»

(272406–272698)

94 %

272528...274144

/product = «hypothetical protein»

272652...274268

/product = «hypothetical protein»

(272829–273208)

94 %

(273303–273649)

92 %

(273909–274205)

93 %

274870...276204

/product = «solute symporter family protein»

(276002–276151)

90 %

(275881–276028)

98 %

274747...276081

/product = «putative sodium symporter»

complement(276287...276487)

/product = «putative inner membrane protein»

(276322–276447)

100 %

(276205–276330)

97 %

complement (276170..276370)

/product = «putative inner membrane protein»

complement(276705...277394)

/gene = «aroG»

/product = «phospho-2-dehydro-3-deoxyheptonate aldolase»

(276606–276819)

100 %

(276928–277080)

100 %

(276486–276702)

80 %

(276811–276963)

93 %

complement (276588...277433)

/product = «putative aldolase (pseudogene)»

complement(277566...280703)

/product = «putative membrane protein»

(277508–277919)

100 %

(277391–277802)

90 %

complement(277449..280766)

/product = «putative membrane protein»

Так, ген штамма хламидий ПП-87, кодирующий фермент белкового семейства 3/-5/ экзорибонуклеаз vacB и RNase II (vacB and RNase II 3/-5/ exoribonucleases family protein) и фактически являющегося белком холодового шока, индуцирующимся при понижении температуры, имеет 99 %-ю идентичность к штамму S26/3 против 95 %-го сходства со штаммом GR9 в части анализируемого локуса.

DnaK-ген ПП-87, кодирующий одноименный белок-шаперон теплового шока или стресс-индуцированный hsp70 (chaperone protein DnaK, heat shock chaperone protein – hsp70), принимающий участие в сворачивании и разворачивании белков, обеспечивая бактериальной клетке нечувствительность к нагреванию, имеет также 99 %-ю идентичность к S26/3 против 95–96 %-го сходства с GR9 в части анализируемых локусов.

GrpE-ген ПП-87, кодирующий белок теплового шока grpE, по сути являющийся кофактором hsp70 (GrpE protein – hsp-70 cofactor), проявляет 99 %-е сходство к S26/3 против 91–94 %-й идентичности к GR9 в части анализируемых локусов.

HrcA репрессор транскрипции, индуцируемый теплом (heat-inducible transcription repressor HrcA) – репрессор белков теплового шока, – регулятор ответа на тепловой стресс, являющийся транскрипционным фактором, в части нуклеотидных последовательностей анализируемых локусов hrcA-гена штамма ПП-87, также имеет наиболее близкородственное сходство c S26/3 (97–98 %), нежели c GR9 (92–95 %).

ProS-ген ПП-87, кодирующий пролил-тРНК-синтетазу (prolyl-tRNA synthetase), в свою очередь взаимодействующую с белком теплового шока DnaK, по анализируемым локусам имеет 97–99 %-ю идентичность к S26/3 против 91–94 %-го сходства с GR9, результаты выравнивания которых только по одному из локусов (S26/3: 260129-260646: GR9: 260250-260767) ранее уже были отображены на представленных рис. 1 и 2.

Еще три гена штамма ПП-87, близлежащих к proS, но прерываемых гипотетическими протеинами (hypothetical proteins), также проявляли большую идентичность (или меньшую гетерогенность) в процентном выражении анализируемых локусов по отношению к штамму S26/3, нежели чем к штамму GR9 (табл. 1–2).

Транслируемые протеины данных трех генов: ABC транспортер семейства субстрат-связывающего белка (ABC transporter substrate binding family protein) с транскрипционной активацией, индуцируемой тепловым шоком; LL-диаминопимелат аминотрансфераза (LL-diaminopimelate aminotransferase) и предполагаемый натриевый симпортер семейства трансмембранного белка-переносчика растворенных веществ (solute symporter family protein, putative sodium symporter).

Вышеперечисленную ассамблею примыкающих друг к другу генов с близкородственным сходством анализируемых локусов штамма ПП-87 к штамму S26/3 фланкируют гены, чьи анализируемые локусы, наоборот, имеют 100 % идентичность к штамму GR9, а именно: гены гипотетических протеинов (hypothetical proteins) и CBS-ген белкового семейства парного домена цистатионин бета-синтазы (CBS domain pair family protein), с одной стороны, и ген предполагаемого внутреннего мембранного белка (putative inner membrane protein), с другой, примыкающий в свою очередь к aroG-гену кодирующему фосфо-2-дегидро-3-дезоксигептонат-альдолазу (phospho-2-dehydro-3-deoxyheptonate).

Заключение

Проанализированные в данной работе гены, кодирующие белки холодового и теплового шока, а также другие близлежащие к ним гены (в т.ч. proS-ген) штамма Chlamydia sp. ПП-87 с их ярко выраженным близкородственным сходством по отношению к штамму Chlamydia abortus S26/3, являются ключом как к раскрытию молекулярных механизмов развития инфекционного процесса с обоснованием патогенеза хламидийной инфекции, ассоциированной с колонизацией плаценты хозяина внутриклеточным паразитом, так и к прояснению эволюции хламидий.

Рецензенты:

Госманов Р.Г., д.в.н., профессор кафедры микробиологии, вирусологии и иммунологии, Казанская государственная академия ветеринарной медицины имени Н.Э. Баумана, г. Казань;

Лутфуллин М.Х., д.в.н., профессор, заведующий кафедрой паразитологии и радиобиологии, Казанская государственная академия ветеринарной медицины имени Н.Э. Баумана, г. Казань.

Работа поступила в редакцию 23.10.2014.