Research on Animal Production
پژوهشهاي توليدات دامي
rap
Agriculture
http://rap.sanru.ac.ir
1
admin
2251-8622
2676-461X
8
10.61186/rap
14
8888
13
fa
jalali
1400
12
1
gregorian
2022
3
1
13
35
online
1
fulltext
fa
بازیابی ژنوتیپ های از دست رفته با استفاده از روش هوشمند K-نزدیکترین همسایگی
Imputation of Missing Genotypes with Intelegent K-Nearest Neighbore Algorithm
ژنتیک و اصلاح نژاد دام
ژنتیک و اصلاح نژاد دام
پژوهشي
Research
<div style="text-align: justify;"><strong>چکیده مبسوط</strong><br>
<strong>مقدمه و هدف:</strong> بازیابی ژنوتیپ در طرح­ های انتخاب ژنومی به دلیل آنکه می­تواند هزینه­ های انتخاب ژنومی را کاهش دهد بدون اینکه تأثیر منفی بر صحت انخاب ژنومی داشته باشد در طی سال­های اخیر مورد توجه محققین قرر گرفته است. در فرآیند بازیابی ژنوتیپ، ژنوتیپ نشانگرهایی که به هر دلیل اطلاعات ژنوتیپی آن­ها از دست رفته است با استفاده از روش ­های مختلف آماری بازیابی می ­شود.<br>
<strong>مواد و روش­ ها:</strong> جهت ایجاد ماتریس ژنوتیپی، ژنومی متشکل از 1 کروموزوم به طول یک مورگان برای 250 و 1000 فرد شبیه ­سازی شد که بر روی آنها در سناریوهای مختلف، 250، 500، 750، 1000، 1500 و 2000 نشانگر چند شکلی تک نوکلئوتیدی (SNP) توزیع گردید. جهت ایجاد فایل اطلاعات حاوی ژنوتیپ­های از دست رفته، اطلاعات ژنوتیپی به ترتیب 5، 10، 25، 50، 75 و 90 درصد SNPها از ماتریس ژنوتیپی حذف شده تا مجدداً توسط روش KNN بازیابی شوند. درصد ژنوتیپ­ های به درستی بازیابی شده (نسبت تعداد ژنوتیپ­ های به درستی بازیابی شده به کل ژنوتیپ­های از دست رفته) و همبستگی بین ماتریس ژنوتیپی اولیه (فاقد اطلاعات ژنوتیپی از دست رفته) و ماتریس ژنوتیپی بازیابی شده به عنوان شاخص ­های صحت بازیابی ژنوتیپ مورد استفاده قرار گرفت.<br>
<strong>یافته­ ها:</strong> در جمعیت شامل 250 فرد صحت بازیابی ژنوتیپ در سناریوهای 5، 10، 25، 50، 75 و 90 درصد، صحت بازیابی ژنوتیپ به ترتیب برابر 0/82، 0/82، 0/80، 0/76، 0/62 و 0/40 بود اما با افزایش جمعیت به 1000 فرد، صحت بازیابی ژنوتیپ برابر 0/83، 0/83، 0/82، 0/82، 0/71 و 0/54 حاصل شد که بویژه تاثیر افزایش جمعیت در دو سناریو 75 و 90 درصد ژنوتیپ از دست رفته قابل توجه بود. همبستگی بین ماتریس ژنوتیپی اولیه و ماتریس ژنوتیپی بازیابی شده نیز با افزایش درصد حذف کاهش یافت. با افزایش تعداد SNPها از 250 به 2000، صحت بازیابی ژنوتیپ از 0/67 به 0/84 افزایش یافت. همچنین یک رابطه معکوس بین فراوانی آلل نادر (MAF) با صحت بازیابی ژنوتیپ مشاهده شد به صورتیکه با افزایش MAF از 01/0 به 5/0، صحت بازیابی ژنوتیپ 15 درصد کاهش نشان داد. مدت زمان بازیابی ژنوتیپ نیز با افزایش ابعاد ماتریس ژنوتیپی به صورت تصاعدی افزایش یافت. با افزایش درصد ژنوتیپ­ های بازیابی شده، صحت پیش­بینی ارزش­ های اصلاحی ژنومی کاهش یافت. در سناریوهای 5 و10 درصد ژنوتیپ بازیابی شده تغییری در صحت مشاهده نشد اما در دو سناریو 75 و 90 درصد ژنوتیپ بازیابی شده، صحت پیش­بینی ارزش­ های اصلاحی ژنومی به ترتیب 16 و 32 درصد کاهش یافت.<br>
<strong>نتیجهگیری: </strong>به طور کلی صحت بازیابی ژنوتیپهای از دست رفته با استفاده از روش KNN قابل قبول بود به طوری که با افزایش درصد ژنوتیپهای از دست رفته تا 50 درصد، KNN با صحتی در حدود 80 درصد ژنوتیپهای از دست رفته را بازیابی نمود و بنابراین می ­توان این روش را برای طرح ­های انتخاب ژنومی پیشنهاد نمود.</div>
<div style="text-align: justify;"><span style="font-size:11pt"><span style="line-height:90%"><span sans-serif="" style="font-family:Calibri,"><b><span new="" roman="" style="font-family:" times=""><span style="color:black">Extended Abstract</span></span></b></span></span></span><br>
<span style="font-size:11pt"><span style="line-height:90%"><span sans-serif="" style="font-family:Calibri,"><b><span new="" roman="" style="font-family:" times=""><span style="color:black">Introduction and Objective:</span></span></b><span new="" roman="" style="font-family:" times=""><span style="color:black"> Genotype imputation in genomic selection schemes has been considered by researchers in recent years because it can reduce the costs of genomic selection without having a negative impact on the accuracy of genomic selection. In the genotype imputation process, markers that their genotypic information has been missed for any reason are imputed using various statistical methods.</span></span></span></span></span><br>
<span style="font-size:11pt"><span style="line-height:90%"><span sans-serif="" style="font-family:Calibri,"><b><span new="" roman="" style="font-family:" times="">Material and Methods:</span></b><span new="" roman="" style="font-family:" times="">To constructe genotypic matrix, a one morgan genome including one chromosome for 250 and 1000 individuals was simulated on which in different scenarios 250, 500, 750, 1000, 1500 and 2000 single necleotide polymorphismes (SNP) was distributed. In order to create genomic matrix including missing genotypes, genotypic information of respectively, 5%, 10%, 25%, 50%, 75% and 90% of SNPs was masked and then imputed with KNN. The percent of genotypes correctly imputed (the ratio of genotypes correctly imputed to total masked genotypes) as well as the correlation between primary genotypic matrix (no missing genotype) and imputed genotypic matrix were used as imputation accuracy.</span></span></span></span><br>
<span style="font-size:11pt"><span style="line-height:90%"><span sans-serif="" style="font-family:Calibri,"><b><span new="" roman="" style="font-family:" times="">Results:</span></b><span new="" roman="" style="font-family:" times=""> In the population including 250 individuals, the accuracy of imputation in the scenarios of 5%, 10%, 25%, 50%, 75% and 90% missing genotypes, were 0.82, 0.82, 0.80, 0.76, 0.62 and 0.40, respectively, but by increasing the size of the population to 1000 individuals, the imputation accuracies as 0.83, 0.83, 0.82, 0.82, 0.71 and 0.54 were obtained which in the scenarios of 75% and 90% of missing genotypes the increase in imputation accuracy was noticable.</span> <span new="" roman="" style="font-family:" times="">The correlation between the primary genotype matrix and the imputed genotypic matrix also decreased with increasing percentage of missing genotypes. In a fixed population size, by increasing the number of SNP from 250 to 2000, imputation accuracy increased from 0.67 to 0.84. In addition, an inverse relationship was observed between MAF and imputation accuracy in a way that by increasing MAF from 0.01 to 0.5, imputation accuracy decreased by 15%.</span><span new="" roman="" style="font-family:" times=""> Computation time increased following increase in dimension of genotypic matrix. Bu increasing the percent of missing genotypes, the accuracy of predicted genomic breeding values decreased. In the scenarios of 5 and 10% of missing genotypes, no change in accuracy was observed, but in the scenarios of 75 and 90% of the missing genotypes, the accuracy of prediction of breeding values decreased by 16 and 32%, respectively.</span></span></span></span><br>
<span style="font-size:11pt"><span style="line-height:90%"><span sans-serif="" style="font-family:Calibri,"><b><span style="line-height:90%"><span new="" roman="" style="font-family:" times=""><span style="color:black">Conclusion:</span></span></span></b> <span new="" roman="" style="font-family:" times="">In general, imputation accuracy of KNN was acceptable in such a way that up to 50% of missing genotypes, KNN imputed missing genotypes with 80% accuracy and therefore one could recommend this algorithm for genomic selection schems.</span></span></span></span></div>
بازیابی ژنوتیپ, فراوانی آلل نادر,نشانگر چند شکلی تک نوکلئوتیدی, K-نزدیکترین همسایگی
Genotype imputation, K-nearest neighbor, Minor allel frequency, Single nucleotide polymorphism
130
138
http://rap.sanru.ac.ir/browse.php?a_code=A-10-557-4&slc_lang=fa&sid=1
Fatemeh
Vanaei
فاطمه
ونایی
fatemeh.vanai@gmail.com
100319475328460017895
100319475328460017895
No
Department of Animal Science, Faculty of Agriculture, Bu-Ali Sina University, Hamedan
گروه علوم دامی، دانشکده کشاورزی، دانشگاه بوعلی سینا، همدان،ایران
Farhad
Ghafouri-Kesbi
فرهاد
غفوری کسبی
farhad_ghy@yahoo.com
100319475328460017896
100319475328460017896
Yes
Department of Animal Science, Faculty of Agriculture, Bu-Ali Sina University, Hamedan
گروه علوم دامی، دانشکده کشاورزی، دانشگاه بوعلی سینا، همدان،ایران
Pouya
Zamani
پویا
زمانی
Zamani.p@gmail.com
100319475328460017897
100319475328460017897
No
Department of Animal Science, Faculty of Agriculture, Bu-Ali Sina University, Hamedan
گروه علوم دامی، دانشکده کشاورزی، دانشگاه بوعلی سینا، همدان،ایران
Ahmad
Ahmadi
احمد
احمدی
Ahahmady@gmail.com
100319475328460017898
100319475328460017898
No
Department of Animal Science, Faculty of Agriculture, Bu-Ali Sina University, Hamedan
گروه علوم دامی، دانشکده کشاورزی، دانشگاه بوعلی سینا، همدان،ایران