بیوانفورماتیک علمی بین رشتهای است که زیستشناسی مولکولی و علوم کامپیوتر را به یکدیگر مرتبط میکند و از طریق فراهم آوردن امکان تحلیل دادههای مولکولی و ژنومی، دانش ما را از ژنوم و عملکرد آن توسعه میدهد. کتابهای کمی به زبان فارسی در رابطه با بیوانفورماتیک وجود دارد و موارد موجود هم اغلب ترجمه هستند. کتاب حاضر نوعی گردآوری و تالیف است که طی سالها مطالعه و تدریس درس بیوانفورماتیک در دوره دکتری به رشته تحریر درآمده و به بررسی بخشهای نظری و عملی بیوانفورماتیک کاربردی پرداخته است. دانشجویان علوم زیستی با مطالعه این کتاب میتوانند اصول بیوانفورماتیک را فرا بگیرند و بهصورت عملی با استفاده از پایگاههای داده و برنامههای کامپیوتری، موارد بیوانفورماتیکی مرتبط با ژن، ژنوم و پروتئوم را بررسی و تحلیل کنند. امروزه تجزیه و تحلیل دادههای نسلهای جدید توالییابی بخش عمده ای از مباحث بیوانفورماتیک را به خود اختصاص داده است و ابزارهای مورد استفاده در بیوانفورماتیک در بسیاری از موارد برای استفاده در R و لینوکس توسعه یافتهاند. به همین دلیل دو فصل از این کتاب به کاربردهای لینوکس و R در بیوانفورماتیک اختصاص داده شده است. امید است که مطالب کتاب حاضر برای دانشجویان بهویژه دانشجویان تحصیلات تکمیلی در مقاطع ارشد و دکتری مرتبط با بیوانفورماتیک مفید باشد.
فصل 1: مقدمه
در فصل اول مقدمهای در مورد تاریخچه بیوانفورماتیک، پیشرفتها و توضیحات اولیهای در مورد الزامات علم بیوانفورماتیک توضیح داده شده است.
فصل 2: پایگاههای داده
توانایی تولید مثل و تکامل در موجودات زنده توسط ژنوم آنها رهبری میشود. به طور معمول ژنوم یک موجود مجموع DNA درون سلول است. از اجزای مهم ژنوم، ژنهای کد کننده پروتئینها هستند. امروزه توالیهای DNA، RNA و ژنوم هزاران موجود به طور جزئی یا کامل توالییابی شده است. این امر به ایجاد دوران جدیدی در تولید دادههای زیستی و اطلاعات ژنومی منجر شده است. بانکهای داده بیوانفورماتیکی اکنون حاوی میلیاردها نوکلئوتید از توالی DNA مربوط به چندصد هزار گونه مختلف هستند. در فصل اول به معرفی برخی پایگاههای داده حاوی این دادهها و روشهایی برای استخراج اطلاعات از آنها میپردازیم.
عناوین مطالب این فصل: پایگاههای داده عمده – منابع NCBI – Entrez و BLSAT – جستجو در Entrez – شماره دسترسی توالیها – بانک داده Nucleotide – بانکهای داده پروتئینی – بانک داده RefSeq – دسترسی به اطلاعات ژنها در Entrez – محدود کردن جستجو در Entrez – جستجو در NCBI از طریق خط فرمان – موسسه بیوانفورماتیک اروپا – پایگاه UniProt – پایگاه ExPASy – پایگاه انسمبل – بیومارت – تمرین
فصل 3: اسید نوکلئیک
بیوانفورماتیک اغلب با تحلیل دادههای مرتبط با ماکرومولکولها همچون اسیدهای نوکلئیک و پروتئینها سروکار دارد. اسیدهای نوکلئیک از اتصال مولکولهایی به نام نوکلئوتید به یکدیگر تشکیل شدهاند. اگرچه ژنوم اغلب موجودارت از اسید دئوکسیریبونوکلئیک (DNA) تشکیل شده است، بسیاری از ویروسها فاقد DNA بوده و ژنوم آنها از اسید ریبونوکلئیک (RNA) تشکیل شده است. RNA با عملکرد خود (RNA غیر کدکننده) و یا با ترجمه به پروتئینها (mRNA) نقش محوری در عملکردهای بیولوژیکی دارد. علاوه بر mRNA، انواع دیگری از RNA در ژنوم تولید میشوند که کد کننده نیستند (به پروتئین ترجمه نمیشوند) ولی نقشهای مهمی را ایفا میکنند. اگرچه روش RNAseq برای بررسی بیان ژنها در فصلی مجزا (فصل 10) به تفصیل بررسی شده است، در فصل سوم به بررسی جنبههای بیوانفورماتیکی انواع مولکولهای مختلف RNA همچون بانکهای داده مرتبط با آنها، توالی، فولدینگ و ساختار دوم و سوم به ویژه در RNAهای غیر کدکننده پرداخته میشود.
عناوین مطالب این فصل: قالب خواندن – انواع RNA – mRNA – بررسی بیان ژن در سطح mRNA – RNAهای غیرکدکننده – RNAهای غیرکدکننده در بانک داده Rfam – RNA ناقل – RNA ریبوزومی – RNAهای کوچک هستهای – RNAهای کوچک هستکی – میکرو RNA – RNAهای کوچک مداخلهگر – RNA غیرکدکننده بلند (lncRNA)
فصل 4: پروتئین
هرگاه يك يا چند پلىپپتيد پيچ و تاب بخورند و شكل فضايى خاصی بهوجود بياورند، پروتئين بهوجود میآید. پروتئینها در بسیاری از فرایندهای بیولوژیکی از جمله ساختاری (مانند کراتین در مو و کلاژن در بافتهای همبند)، انتقال (مانند هموگلوبین که اکسیژن را در خون حمل میکند) و سیگنالدهی (هورمونها و پروتئینهای گیرنده) نقش دارند. گروهی از پروتئینها آنزيم هستند و در واكنشهاى زیستی دخالت دارند. پروتئینها دارای تنوع بالایی در ساختار و عملکرد هستند و در درک فرایندهای زیستی و ایجاد داروهای جدید نقش کلیدی دارند. فصل چهارم به بررسی واحدهای سازنده پروتئینها یعنی اسیدهای آمینه و ویژگیهای فیزیکوشیمیایی آنها، تکامل پروتئینها، ساختار پروتئینها در سطوح مختلف شامل ساختار اول، دوم سوم و چهارم و مفاهیمی همچون موتیف و دمین پروتئینی میپردازد. علاوه بر این از آنجا که نقش اصلی پروتئین به ساختار سه بعدی آن وابسته است، سعی میشود روشهای مختلف پیشبینی و مشاهده ساختار پروتئینها توضیح داده شود.
عناوین مطالب این فصل: اسیدآمینه – همولوژي، تشابه و یکسانی – دمین و موتیف – موتیف – ویژگیهای فیزیکی پروتئین – دمینهای غشاگذر – سیگنال پپتید – هستیشناسی ژنها – سازماندهی پروتئین – نقش پروتئین – ویژگیهای فیزیکوشیمیایی اسيدآمینه – ساختار پروتئین – ارتباط بین توالی و ساختار – ساختار سوم و چهارم پروتئین – بانک داده پروتئین (PDB) – پیشبینی ساختار سوم از طریق همولوژی – پیشبینی ساختار سوم از ابتدا – ارزیابی دقت ساختارهای سوم حاصل از هوش مصنوعی – پایگاه AlphaFoldDB – داکینگ مولکولی – آشنایی با پایمول – آشنایی با راسمول – تمرین
فصل 5:انطباق دوتایی توالیها
بنياديترين مرحله در بررسی ساختار و عملكرد یک توالي بیولوژیکی، مقايسه و تطبیق دادن آن با سایر تواليهای موجود است. انطباق یا همردیفی میتواند از طریق چیدن توالیها زیر هم انجام شود طوریکه نواحی مشابه بین توالیها را مشخص کند. در این صورت، مشاهده درجه معنیداری از شباهت توالی مورد نظر با سایر توالیها، میتوان گفت احتمالاً این توالیها با یکدیگر مرتبط بوده و یا از یک جد مشترک به وجود آمدهاند و نقش و علمکرد مشابهی دارند. با مقايسه و انطباق تواليها، ميتوان مناطق حفاظت شده و تغييریافته را تشخيص داد و ساختار و عملكرد تواليهای ناشناخته را پيشگويي کرد.
عناوین مطالب این فصل: نمودار نقطهای – انطباق دو توالي – ماتریسهای PAM – ماتریسهای BLOSUM – فاصله – انواع انطباق – روش برنامهنویسی پویا – انطباق سراسری – انطباق محلی- انطباق توالیهای نوکلئوتیدی – برنامه BLAST – نحوه کارکرد BLAST – سیستم امتیازدهی – امتیاز انطباق – انواع برنامههای BLAST – الگوریتمهای مختلف BLAST – BLAST در کامپیوتر شخصی – ایجاد پایگاه داده پروتئینی یا DNA – بلاست علیه دیتابیس ساخته شده – جستجو در دیتابیسهای آنلاین NCBI – الگوریتمهای جدید انطباق – تمرین
فصل 6: انطباق چندگانه
انطباق چندگانه به انطباق سه توالی یا بیشتر گفته میشود و فرض بر این است که توالیها با یکدیگر همولوگ هستند. نتیجه انطباق، شباهت توالیها را نشان داده و آنالیزهای فیلوژنتیکی را ممکن میسازد. در یک انطباق چندگانه واحدهای حفاظت شده زیر هم قرار میگیرند، جهشهای نقطهای در ستونهایی نمایان میشوند و حذفها با خط تیره مشخص میگردند. انطباق چندگانه همچنین اطلاعاتی را در مورد ساختارهای دوم و سوم پروتئینها بهدست میدهد. از سایر کاربردهای انطباق چندگانه میتوان به مطالعات فیلوژنی و بررسیهای تکاملی، شناسایی همولوژی، شناسایی بلوکهای حفاظتشده برای طراحی آغازگر یا کاوشگر، تحلیل جهشها و طراحی آزمایشات جهشزایی و سرهمبندی خوانشهای توالییابی اشاره کرد. در این فصل سعی میشود اصول و روشهای انجام انطباق چندگانه توضیح داده شود.
عناوین مطالب این فصل: اصول انطباق چندگانه – تکرار – برنامه جالویو – فرمتهای متداول MSA – الگوی توالی – لوگو – پروفایل – مدل مارکوف مخفی (HMM) – پایگاههای داده ترکیبی InterPro و iProClass – پایگاه Pfam – پایگاه SMART – پایگاه CDD – تمرین
فصل 7: فیلوژنی
چارلز داروین نظریه تکامل درباره منشأ گونهها بهوسیله انتخاب طبیعی بیان داشت که تلاش برای بقا باعث انتخاب طبیعی میشود. بهطوری که فرزندان با والدین خود متفاوت هستند و افراد مناسبتر برای یک محیط معین انتخاب میشوند. به این ترتیب، در طول دوران طولانی، گونهها تغییر یافته و تکامل مییابند بهطوری که فرزندان از نظر ساختاری و عملکردی با اجداد خود متفاوت هستند. لذا تکامل به ایجاد گونههای جدید از گونههای قبلی از طریق تغییرات قابل توارث و انتخاب طبیعی گفته میشود و در این مسیر، انتخاب طبیعی عامل اصلی تکامل است که اشکال ناسازگار را حذف و اشکال سازگار را انتخاب میکند. فیلوژنتیک مطالعه روند تکامل موجودات که در آن اجداد و شجرهنامه معمولا با نمودارهای درختی نشان داده میشوند و فیلوژنی الگوی انشعاب روند تکامل و واگرایی تاکسونها را نشان میدهد. در سطح مولکولی، تکامل حاصل جهش در نوکلئوتیدها و انتخاب است. فیلوژنی کلاسیک بر مقایسه ویژگیهای مورفولوژیکی بین موجودات متکی بود در حالی که امروزه از دادههای مولکولی نیز برای آنالیزهای فیلوژنتیکی استفاده میشود. هدف این فصل ارائه اصول و روشهای فیلوژنی مولکولی است.
عناوین مطالب این فصل: مروری بر ظهور فیلوژنی مولکولی – نرخ جایگزینی نوکلئوتید و زمان انشقاق – انتخاب مثبت یا انتخاب منفی – تئوری خنثی تکامل – فیلوژنی مولکولی و ساختار درخت – ریشه درخت – شکل متنی درخت – تعداد درختهای ریشهدار و بیریشه – انواع درخت – درخت گونهها در مقابل توالی (ژن یا پروتئین) – درخت براساس پروتئین، DNA یا RNA – مراحل آنالیز فیلوژنی – انطباق چندگانه – مدلهای تکاملی برای پروتئین و DNA – توزیع نرخ جایگزینی محلهای مختلف – مقایسه مدلها – انطباق با MAFFT در لینوکس – ایجاد درخت – روشهای مبتنی بر فاصله – روش UPGMA – روش اتصال همسایهها – روش حداکثر صرفهجویی – مراحل روش حداکثر صرفهجویی – روش حداکثر درستنمایی – روش تکامل حداقلی – روش استباط بیزی – ارزیابی درخت – استفاده از مگا برای فیلوژنی – رسم درخت در R – تمرین
فصل 8: واکنش زنجیرهای پلیمراز کمی
واکنش زنجیرهای پلیمراز یا PCR روشی آزمایشگاهی است که برای تکثیر قطعه مشخصی از DNA به کار میرود. این ویژگی کاربردهای وسیعی در تحقیقات ژنتیکی از جمله بررسی ژنها و توالیهای DNA، بررسی تنوع ژنتیکی، بررسی جهشها و پلیمرفیسم و بررسی بیان ژنها دارد و جزء جداییناپذیر در بیوتکنولوژی و زیستشناسی است. از طریق PCR، بهویژه PCR کمی (qPCR)، امکان بررسی میزان رونویسی و بیان ژنها وجود دارد. علاوه بر این، PCR برای تأیید یافتههای حاصل از آزمایشهای RNAseq استفاده میشود، تا دقت پروفایلهای بیان ژن تولید شده توسط توالییابی را تضمین کند. در این فصل به بررسی اصول qPCR از جمله طراحی آزمایش، طراحی آغازگر و آنالیز داده های حاصل از qPCR پرداخته میشود.
عناوین مطالب این فصل: واکنش زنجیرهای پلیمراز – واکنش زنجیرهای پلیمراز در زمان واقعی – رنگهای اتصال به DNA – بررسی بیان ژن با روش qPCR – نکات طراحی آغازگر برای qPCR – طراحی آغازگر – رسم منحنی استاندارد و محاسبه کارایی تکثیر – روشهای آنالیز دادههای qPCR – آنالیز بیان ژن از طریق Fold Change – استفاده از R برای آنالیز دادههای qPCR – تهیه جدول دادههای ورودی برای بسته rtpcr – بررسی Fold Change (یک ژن و یک تا سه فاکتور) – مثال دوم (یک ژن و یک فاکتور با بیش از دو سطح) – مثال سوم (یک ژن و دو فاکتور) – بررسی Fold Change (چند ژن و یک فاکتور) – بررسی Relative expression (یک ژن و دو فاکتور) – بررسی Relative expression (یک ژن و سه فاکتور) – تمرین
فصل 9: ژنوم
ژنومیکس محاسباتی شاخهای مهم از بیونفورماتیک است. ژنومیکس به توالییابی کل یک ژنوم و شناسایی ژنها و پروتئینها و نقش آنها میپردازد، در حالی که ژنومیکس کاربردی از دادههای ژنومیکس استفاده میکند تا نحوه عمل ژنها و پروتئینها را مشخص کند. امروزه با ابداع روشهای نسل دوم و سوم توالی یابی، هر روزه ژنوم موجودات مختلف در حال توالییابی است. آنچه توالییابی به دست میدهد حجم زیادی از خوانشهای کوتاه از ژنوم است. یکی از چالشهای بیوانفورماتیک سرهمبندی این خوانشها در قالب کروموزومها، شناسایی ژنها و سایر توالیهای مرتبط و حاشیهنویسی آنها است. در فصل نهم سعی میشود با اصول اولیه توالییابی ژنوم، سرهمبندی ژنوم و حاشیهنویسی ژنها آشنا شویم.
عناوین مطالب این فصل: ساختار ژن در یوکاریوتها – توالییابی ایلومینا – توالییابی Mate-Pair – تولییابی و سرهمبندی ژنوم – سرهمبندی خوانشها – انطباق خوانشها به ژنوم – انطباق با الکوریتم SSAHA2 – انطباق براساس تبدیل Burrows–Wheeler – سرهمبندی ژنوم – حاشیهنویسی – فایل GTF یا GFF – فایل BED – دوبرابر شدگی قطعهای – تکرارهای پیاپی – انواع ژنها – یافتن ژنهای کدکننده در ژنوم یوکاریوتی – پارادوکس ژنهای کدکننده – سینتنی – تعیین نقش ژنها – روشهای ژنتیک مستقیم – روشهای ژنتیک معکوس – تعامل پروتئین-پروتئین – شناسایی اعضای یک خانواده ژنی – رسم نقشه فیزیکی ژنها و ساختار دمین و موتیف پروتئینها – تمرین
فصل 10: ترانسکریپتوم
تکنیک RNASeq توالییابی همه رونوشتهای یک نمونه RNA است که با استفاده از روشهای توالییابی جدید انجام میشود. تحلیل دادههای RNASeq توالی مولکولهای RNA را تعیین و پروفایل بیان ژنها را از طریق شمارش تعداد رونوشت آنها بهدست میدهد. امروزه بررسی بیان ژنها از طریق روش RNAseq قسمت مهمی از بحثهای ترانسکریپتوم را به خود اختصاص داده است. لذا در فصل دهم اصول تحلیل داده های RNAseq توضیح داده میشود. تحلیل دادههای RNAseq حتی اگر توالی ژنوم رفرنس در اختیار نباشد قابل انجام است و در کل قابلیت شناسایی رونوشتها و ایزوفرمهای جدید را دارد، مرز بین اگزون/اینترون را در رونوشتها مشخص و لذا ویرایش متناوب را بررسی میکند و در صورت وجود، چندشکلیهای نوکلئوتیدی را در رونوشتها بهدست میدهد.
عناوین مطالب این فصل: طراحی آزمایش – انطباق خوانشها – جهت توالییابی – کنترل کیفیت فایلها و ویرایش خوانشها – مسیر hisat2 و htseq-count – نصب برنامهها و انطباق خوانشها – مشاهده گرافیکی انطباق – شمارش خوانشهای انطباقیافته – نرمالسازی توزیع دادهها – نرمالسازی برای عمق توالییابی و طول ژنها – کاربرد لگاریتم fold change در تحلیل دادههای RNA-seq – مقدار احتمال تصحیحشده – تصحیح بونفرونی – تصحیح بنجامینی هاچبرگ – مراحل انجام روش بنجامینی هاچبرگ – مقایسه آماری بیان ژنها – تمرین
فصل 11: پروتئوم
پروتئوم به کل پروتئینهای بیان شده یا تمام محصولات ترجمه شدهی ژنوم در یک سلول گفته میشود. پروتئومیکس به مطالعهی پروتئوم گفته میشود که شامل بررسی همزمان همهی پروتئینهای ترجمه شده در یک سلول میباشد. پروتئومیکس دامنه متنوعی از بررسیها نظیر شناسایی و تعیین کمیت پروتئینها در مقیاس زیاد و مشخص کردن محلهای جایگزینی پروتئینها، تغییرات برهمکنش و عملکرد آنها را در بر میگیرد. در مقایسه با پروفایل بیانی ژنها، پروتئومیکس مزیتهای دیگری در بررسی عملکرد ژنها دارد. پروتئومیکس روشی مستقیم برای درک رفتار سلول است چرا که عملکرد ژن عمدتاً توسط پروتئین مشخص میشود. بررسی ترانسکریپتوم بهتنهایی برای بررسی عملکرد سلول کافی نیست زیرا اولا بین mRNAها و پروتئینهای سلول رابطه یک به یک وجود ندارد، ثانیاً یک ژن یوکاریوتی میتواند بدلیل پیرایش متناوب RNA، پروتئینهای متفاوتی تولید کند. سایر پیچیدگیهای عملکردی پروتئینها را میتوان در تغییرات پس از ترجمه، هدفگیری پروتئینها و برهمکنشهای آنها یافت. عدم همبستگی mRNA و پروتئینها بدین معنی است که پروتئومیکس میتواند اطلاعات بیشتری برای درک عملکرد ژنها در اختیار قرار دهد. در این فصل مباحث اصلی پروتئومیکس مثل شناسایی پروتئینها، بررسی بیان پروتئین، تغییرات پس از ترجمه، گروهبندی پروتئینها و تعامل پروتئین-پروتئین با تاکید بر جنبههای بیوانفورماتیکی مورد بحث قرار میگیرد.
عناوین مطالب این فصل: روشهای بررسی بیان پروتئینها – 2D-PAGE – شناسایی پروتئینها با استفاده از طیفسنجی جرمی – شناسایی پروتئین از طریق جستجوی پایگاههای داده – الکتروفورز درونژلی تفریقی – مطالعات چند-اومیک
فصل 12: آشنایی با لینوکس
لینوکس بهعنوان یک سیستم عامل مجانی و قابل توسعه، در بیوانفورماتیک کاربردهای گستردهای دارد. برخی از کاربردهای لینوکس در بیوانفورماتیک عبارتند از: ۱. قابلیت پردازش دادههای بزرگ و همچنین پشتیبانی از زبانهای برنامهنویسی متعدد مانند R، پایتون و پرل، برای تجزیه و تحلیلهای بیوانفورماتیکی. ۲. بسیاری از نرمافزارهای بیوانفورماتیکی برای لینوکس نوشته میشوند و روی این سیستم عامل به خوبی اجرا میشوند. ۳. لینوکس با دستورالعملهای خط فرمان قدرتمند خود، به کاربران اجازه میدهد تا پردازش دادهها را به خوبی کنترل کنند. بستههای بیوانفورماتیکی زیادی برای مواردی چون بلاست، فیلوژنی، آنالیز DNA، آنالیز دادههای RNAseq و سایر دادههای حاصل از توالییابی نسل دوم و سوم، مقایسه ژنومها و حاشیهنویسی ژنوم، برای استفاده در خط فرمان وجود دارند. کاربر میتواند از طریق ترمینال لینوکس، دستورات مختلف bash (تحلیلگر فرمان در لینوکس و مکینتاش) را تایپ و اجرا کند. همه کسانی که نیاز به کار با دادههای توالییابی نسل جدید (NGS) دارند، با این سیستمعامل آشنا نیستند و به حداقل یک معرفی مختصر در این زمینه نیاز دارند تا دستورات موردنیاز را یاد بگیرند. هدف فصل دوازدهم آشنایی با لینوکس است. پوشش تمام جنبههای لینوکس ممکن نیست، اما هدف این است که کاربران بتوانند از ابزارهای معمول بیوانفورماتیکی در لینوکس استفاده کنند.
عناوین مطالب این فصل: نصب WSL در ویندوز 10 – نصب WSL در ویندوز 11 – دستور و فلگ – علامت پایپ – برخی دستورات کاربردی در لینوکس – دستور awk – دستور tr – دستورsed – دستورات فشردهسازی – معرفی یک برنامه به PATH در لینوکس – برنامه samtools – برنامه seqkit – ایجاد اسکریپت shell در لینوکس – محیط در لینوکس – ایجاد محیط و نصب بستهها در لینوکس – ذخیرهکردن محیط – ایجاد محیط در R – استفاده از کانتینرهای داکر – نمونهگیری از فایلهای paired end – تمرین
فصل 13: آشنایی با R
نرمافزار R از طریق خط فرمان، دستورات را اجرا میکند. در فصلهای قبلی مثالهایی از کاربرد R در بیوانفورماتیک مانند انطباق دوتایی (در تمرینهای صفحه 89)، رسم درخت فیلوژنی (صفحه 141) و رسم لوگو (صفحه 101) ذکر شده است. در فصل سیزدهم سعی میشود خواننده با توابع پایه در R آشنا شود و نحوه استفاده از آنها را فراگیرد. با این حال برای یادگیری بیشتر، نیاز به مراجعه به راهنمای توابع مختلف و همچنین منابعی است که بهطور ویژه به آموزش R پرداختهاند.
عناوین مطالب این فصل: نصب و اجرای برنامه – عملیات ریاضی ساده – متغیر – توابع – انواع داده در R – بردار – ایجاد بردارهای منظم – ماتریس – ماتریس واحد – ضرب ماتریس در یک مقدار ثابت – برگردان ماتریس – عکس ماتریس – ساختار داده – لیست – آرایه – نصب و بارگذاری پکیجها – استخراج زیرمجموعهای از جدول – جستجوی متن باgrep – تعریف پوشه کاری – فراخوانی دادهها از فایل و ذخیره کردن جدول – توصیف دادهها – توابع خانواده apply – تابع apply – تابع lapply – تابع sapply – تابع tapply – استفاده از توابع group_by و summarise – مصورسازی در R – برنامهنویسی در R – حلقه – ایجاد تابع – معرفی بایوپایتون برای بیوانفورماتیک – تمرین




