دوره 13، شماره 35 - ( بهار 1401 )                   جلد 13 شماره 35 صفحات 138-130 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Vanaei F, Ghafouri-Kesbi F, Zamani P, Ahmadi A. (2022). Imputation of Missing Genotypes with Intelegent K-Nearest Neighbore Algorithm. rap. 13(35), 130-138. doi:10.52547/rap.13.35.130
URL: http://rap.sanru.ac.ir/article-1-1199-fa.html
ونایی فاطمه، غفوری کسبی فرهاد، زمانی پویا، احمدی احمد. بازیابی ژنوتیپ های از دست رفته با استفاده از روش هوشمند K-نزدیکترین همسایگی پژوهشهاي توليدات دامي 1401; 13 (35) :138-130 10.52547/rap.13.35.130

URL: http://rap.sanru.ac.ir/article-1-1199-fa.html


گروه علوم دامی، دانشکده کشاورزی، دانشگاه بوعلی سینا، همدان،ایران
چکیده:   (1338 مشاهده)
چکیده مبسوط
مقدمه و هدف: بازیابی ژنوتیپ در طرح­ های انتخاب ژنومی به دلیل آنکه می­تواند هزینه­ های انتخاب ژنومی را کاهش دهد بدون اینکه تأثیر منفی بر صحت انخاب ژنومی داشته باشد در طی سال­های اخیر مورد توجه محققین قرر گرفته است. در فرآیند بازیابی ژنوتیپ، ژنوتیپ نشانگرهایی که به هر دلیل اطلاعات ژنوتیپی آن­ها از دست رفته است با استفاده از روش ­های مختلف آماری بازیابی می ­شود.
مواد و روش­ ها: جهت ایجاد ماتریس ژنوتیپی، ژنومی متشکل از 1 کروموزوم به طول یک مورگان برای 250 و 1000 فرد شبیه ­سازی شد که بر روی آنها در سناریوهای مختلف، 250، 500، 750، 1000، 1500 و 2000 نشانگر چند شکلی تک نوکلئوتیدی (SNP) توزیع گردید. جهت ایجاد فایل اطلاعات حاوی ژنوتیپ­های از دست رفته، اطلاعات ژنوتیپی به ترتیب 5، 10، 25، 50، 75 و 90 درصد SNPها از ماتریس ژنوتیپی حذف شده تا مجدداً توسط روش KNN بازیابی شوند. درصد ژنوتیپ­ های به درستی بازیابی شده (نسبت تعداد ژنوتیپ­ های به درستی بازیابی شده به کل ژنوتیپ­های از دست رفته) و  همبستگی بین ماتریس ژنوتیپی اولیه (فاقد اطلاعات ژنوتیپی از دست رفته) و ماتریس ژنوتیپی بازیابی شده به عنوان شاخص ­های صحت بازیابی ژنوتیپ مورد استفاده قرار گرفت.
یافته­ ها: در جمعیت شامل 250 فرد صحت بازیابی ژنوتیپ در سناریوهای 5، 10، 25، 50، 75 و 90 درصد، صحت بازیابی ژنوتیپ به ترتیب برابر 0/82، 0/82، 0/80، 0/76، 0/62 و 0/40 بود اما با افزایش جمعیت به 1000 فرد، صحت بازیابی ژنوتیپ برابر 0/83، 0/83، 0/82، 0/82، 0/71 و 0/54 حاصل شد که بویژه تاثیر افزایش جمعیت در دو سناریو 75 و 90 درصد  ژنوتیپ از دست رفته قابل توجه بود. همبستگی بین ماتریس ژنوتیپی اولیه و ماتریس ژنوتیپی بازیابی شده نیز با افزایش درصد حذف کاهش یافت. با افزایش تعداد SNPها از 250 به 2000، صحت بازیابی ژنوتیپ از 0/67 به 0/84 افزایش یافت. همچنین یک رابطه معکوس بین فراوانی آلل نادر (MAF) با صحت بازیابی ژنوتیپ مشاهده شد به صورتیکه با افزایش MAF از 01/0 به 5/0، صحت بازیابی ژنوتیپ 15 درصد کاهش نشان داد. مدت زمان بازیابی ژنوتیپ نیز با افزایش ابعاد ماتریس ژنوتیپی به صورت تصاعدی افزایش یافت. با افزایش درصد ژنوتیپ­ های بازیابی شده، صحت پیش­بینی ارزش­ های اصلاحی ژنومی کاهش یافت. در سناریوهای 5 و10 درصد ژنوتیپ بازیابی شده تغییری در صحت مشاهده نشد اما در دو سناریو 75 و 90 درصد ژنوتیپ بازیابی شده، صحت پیش­بینی ارزش­ های اصلاحی ژنومی به ترتیب 16 و 32 درصد کاهش یافت.
نتیجه‌گیری: به طور کلی صحت بازیابی ژنوتیپ‌های از دست رفته با استفاده از روش KNN قابل قبول بود به طوری که با افزایش درصد ژنوتیپ‌های از دست رفته تا 50 درصد، KNN با صحتی در حدود 80 درصد ژنوتیپ‌های از دست رفته را بازیابی نمود و بنابراین می ­توان این روش را برای طرح ­های انتخاب ژنومی پیشنهاد نمود.
متن کامل [PDF 1120 kb]   (377 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: ژنتیک و اصلاح نژاد دام
دریافت: 1400/2/15 | ویرایش نهایی: 1401/4/26 | پذیرش: 1400/9/16 | انتشار: 1401/1/10

فهرست منابع
1. Ahmadi, Z. 2020. Comparison of efficiency of rrBLUP-method6 approach with some common methods in genomic evaluation of livestock. MSc thesis, Bu-Ali Sina University, Hamedan, Iran.
2. Berry, D.P. and J.F. Kearney. 2011. Imputation of genotypes from low- to high-density genotyping platforms and implications for genomic selection. Animal, 5: 1162-1169. [DOI:10.1017/S1751731111000309]
3. Bidder, O.R., H.A. Campbell, A. Gómez-Laich, P. Urgé, J. Walker, Y. Cai and R.P Wilson. 2014. Love thy neighbour: automatic animal behavioral classification of acceleration data using the k-nearest neighbour algorithm. PLoS ONE, 9: 1-7. [DOI:10.1371/journal.pone.0088609]
4. Cleveland, M.A. and J.M. Hickey. 2013. Practical implementation of cost-effective genomic selection in commercial pig breeding using imputation. Journal of Animal Science, 91: 3583-3592. [DOI:10.2527/jas.2013-6270]
5. De los Campos, G. and P. Perez Rodriguez. 2018. Bayesian Generalized Linear Regression. Available at: https://cran.r-project.org/web/packages/BGLR/index.html.
6. Elshire, R.J., J.C. Glaubitz, Q. Sun, J.A. Poland and K. Kawamoto. 2011. A robust, simple genotyping-bysequencing (GBS) approach for high diversity species. PLOS ONE, 6: e19379. [DOI:10.1371/journal.pone.0019379]
7. Eskelson, B.N.I., H. Temesgen, V. Lemay, T.M. Barrett, N.L. Crookston and A.T. Hudak. 2009. The roles of nearest neighbor methods in imputing missing data in forest inventory and monitoring databases. Scandinavian Journal of Forest Research, 24: 235-246. [DOI:10.1080/02827580902870490]
8. Ghafouri-Kesbi, F. and A. Goudarztalejerdi. 2018. Studying the performance of intelligent singular value decomposition algorithm (svd) in imputation of missing genotypes in different scenarios of number of marker, population size and minor allele frequency. Iranian Journal of Animal Science Research, 4: 553-560.
9. Ghafouri-Kesbi, F., F. Vanaei, P. Zamani and A. Ahmadi. 2021. Evaluating the performance of Random Forest in imputation of missing genotypes. The first Symposium of Research Highlights in Animal Breeding. Urmia University, Urmia, Iran.
10. Heidaritabar, M., M.P.L. Calus, A. Vereijken, A. Martien, M. Groenen and J.W.M. Bastiaansen. 2015. Accuracy of imputation using the most common sires as reference population in layer chickens. BMC Genetics, 16: 101. [DOI:10.1186/s12863-015-0253-5]
11. Hickey, J.M., J. Crossa, R. Babu and G. de los Campos. 2012. Factors affecting the accuracy of genotype imputation in populations from several maize breeding programs. Crop Science, 52: 654-663. [DOI:10.2135/cropsci2011.07.0358]
12. Lin, P., S.M. Hartz, Z. Zhang, S.F. Saccone and J. Wang. 2010. A new statistic to evaluate imputation reliability. PLoS ONE, 5: e9697. [DOI:10.1371/journal.pone.0009697]
13. Liu, C.H., C.F, Tsa, K.L. Sue and M.W. Huang. 2020. The feature selection effect on missing value imputation of medical datasets. Applied Science, 10: 2344. [DOI:10.3390/app10072344]
14. Mahmoud, H.A., E. Hdadad, F.A. Mousa and A. Hassanien. 2015. Cattle classifications system using fuzzy k- nearest neighbor classifier. International Conference on Informatics, Electronics and Vision (ICIEV), Fukuoka, Japan. [DOI:10.1109/ICIEV.2015.7334010]
15. Meuwissen T.H., B.J. Hayes and M.E. Goddard. 2001. Prediction of total genetic value using genome-wide dense marker maps. Genetics, 157: 1819-29. [DOI:10.1093/genetics/157.4.1819]
16. Mohammadi, Y. and M. Sattaei-Mokhtari. 2018. Accuracy of genomic breeding values in small genotyped populations-A simulation study. Research on Animal Production, 9: 123-128 (In Persian). [DOI:10.29252/rap.9.20.123]
17. Mohammadi, Y. and J. Ahmadpanah. 2021. Effect of reference population size and imputation methods on the accuracy of imputation in pure and mixed populations. Research on Animal Production, 11: 109-114 (In Persian).
18. Pei, Y.F., J. Li, L. Zhang, C.J. Papasian and H.W. Deng. 2008. Analyses and comparison of accuracy of different genotype imputation methods. PLoS ONE, 3: e3551. [DOI:10.1371/journal.pone.0003551]
19. Roshyara, N.B. and M. Scholz. 2015. Impact of genetic similarity on imputation accuracy. BMC Genetics,16: 90. [DOI:10.1186/s12863-015-0248-2]
20. Roshyara, N.R., K. Horn, H. Kirsten, P. Ahner and M. Scholz. 2016. Comparing performance of modern genotype imputation methods in different ethnicities. Scientific Reports, 6: 34386. [DOI:10.1038/srep34386]
21. Salau, J., J.H. Haas, W. Junge and G. Thaller. 2020. Determination of body parts in holstein friesian cows comparing neural networks and k nearest neighbour classification. Animal, 29: 50. [DOI:10.3390/ani11010050]
22. Schwender, H. 2012. Imputing missing genotypes with weighted k nearest neighbors. Journal of Toxicology and Environmental Health, 75: 438-446. [DOI:10.1080/15287394.2012.674910]
23. Schrooten, C., R. Dassonneville, V. Ducrocq, R.F. Brøndum, M.S. Lund and J. Chen. 2014. Error rate for imputation from the Illumina BovineSNP50 chip to the Illumina BovineHD chip. Genetic Selection Evolution, 46: 10. [DOI:10.1186/1297-9686-46-10]
24. Shen, W., F. Cheng, Y. Zhang, X. Wei, Q. Fu and Y. Zhang. 2019. Automatic recognition of ingestive-related behaviors of dairy cows based on triaxial acceleration. Information Processing in Agriculture, 7: 427-443. [DOI:10.1016/j.inpa.2019.10.004]
25. Su, G., R.F. Brøndum., P. Ma, B. Guldbrandtsen, G.P. Aamand and M.S. Lund. 2012. Comparison of genomic predictions using medium-density (~54,000) and high-density (~777,000) single nucleotide polymorphism marker panels in Nordic Holstein and Red Dairy Cattle populations. Journal of Dairy Science, 95: 4657-4665. [DOI:10.3168/jds.2012-5379]
26. Technow, F. 2013. hypred: Simulation of genomic data in applied genetics. Available at: http://cran.rproject.org/web/packages/hypred/index.html.
27. Troyanskaya, O., M. Canto, G. Sherlock, P. Brown, T. Hastie, R. Tibshirani, D. Botstein and R.B. Altman. 2001. Missing value estimation methods for DNA microarrays. Bioinformatics, 17: 520-525. [DOI:10.1093/bioinformatics/17.6.520]
28. VanRaden, P.M. 2008. Efficient methods to compute genomic predictions. Journal of Dairy Science, 91: 4414-4423. [DOI:10.3168/jds.2007-0980]
29. Vereijken, A.L.J., G.A.A. Albers and J. Visscher. 2010. Imputation of SNP genotypes in chicken using a reference panel with phased haplotypes. 10th World Conference of Genetics Applied on Livestock Production, 407, Germany.
30. Wang, Y., Z. Cai, P. Stothard, S. Moore, R. Goebel, L. Wang and L. Guohui. 2012. Fast accurate missing SNP genotype local imputation. BMC Research Notes, 5: 404. [DOI:10.1186/1756-0500-5-404]
31. Wang, J., M. Bell, X. Liu and G. Liu. 2020. Machine-learning techniques can enhance dairy cow estrus detection using location and acceleration data. Animals, 10: 1160. [DOI:10.3390/ani10071160]
32. Weng Z., Z. Zhang, X. Ding, W. Fu, P. Ma, C. Wang and Q. Zhang. 2012. Application of imputation methods to genomic selection in Chinese Holstein cattle. Journal of Animal Science and Biotechnology, 3: 6. [DOI:10.1186/2049-1891-3-6]
33. Wu, D., Q. Wu, X. Yin, B. Jiang, H. Wang, D. He and H. Song. 2020. Lameness detection of dairy cows based on the YOLOv3 deep learning algorithm and a relative step size characteristic vector. Biosystems Engineering, 189: 150-163. [DOI:10.1016/j.biosystemseng.2019.11.017]

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به پژوهشهای تولیدات دامی می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2024 CC BY-NC 4.0 | Research On Animal Production

Designed & Developed by : Yektaweb