بیوانفورماتیک

  • نام کتاب: بیوانفورماتیک
  • پدیدآورندگان : قادر میرزاقادری
  • ناشر : انتشارات دانشگاه کردستان
  • نوبت و سال چاپ : اول، 1404
  • شابک : 2-57-8211-622-978
  • تعداد صفحات: 308، مصور.
  • مشخصات نشر : سنندج، دانشگاه کردستان 1404
  • موضوع: زیست‌انفورماتیک(Bioinformatics)، زیست‌انفورماتیک — نرم‌افزار (Bioinformatics — Software)،  نوکلئوتیدها — توالی — برنامه‌های کامپیوتری Nucleotide sequence) Computer programs)، آر (زبان برنامه‌نویسی کامپیوتر) R (Computer program language )‎، زیست‌انفورماتیک — منابع شبکه کامپیوتری (Bioinformatics — Computer network resources)
    ‏‫ویراستار : رحمان ابراهیم‌زادگان، مهدی کشاورزیان
  • صفحه آرا : قادر میرزاقادری
  • شناسه افزوده :دانشگاه کردستان
  • شماره کتابشناسی ملی: 10188430
  • رکورد کتابشناسی: فیپا

2,000,000 ریال

موجود در انبار

somdn_product_page

درباره نویسنده

قادر میرزاقادری

بیوانفورماتیک علمی بین رشته‌‌ای‌ است که زیست‌شناسی مولکولی و علوم کامپیوتر را به یکدیگر مرتبط می‌کند و از طریق فراهم آوردن امکان تحلیل داده‌های مولکولی و ژنومی، دانش ما را از ژنوم و عملکرد آن توسعه می‌دهد. کتاب‌های کمی به زبان فارسی در رابطه با بیوانفورماتیک وجود دارد و موارد موجود هم اغلب ترجمه هستند. کتاب حاضر نوعی گردآوری و تالیف است که طی سال‌ها مطالعه و تدریس درس بیوانفورماتیک در دوره دکتری به رشته تحریر درآمده و به بررسی بخش‌های نظری و عملی بیوانفورماتیک کاربردی پرداخته است. دانشجویان علوم زیستی با مطالعه این کتاب می‌توانند اصول بیوانفورماتیک را فرا بگیرند و به‌صورت عملی با استفاده از پایگاه‌های داده و برنامه‌های کامپیوتری، موارد بیوانفورماتیکی مرتبط با ژن، ژنوم و پروتئوم را بررسی و تحلیل کنند. امروزه تجزیه و تحلیل داده‌های نسل‌های جدید توالی‌یابی بخش عمده ای از مباحث بیوانفورماتیک را به خود اختصاص داده است و ابزارهای مورد استفاده در بیوانفورماتیک در بسیاری از موارد برای استفاده در R و لینوکس توسعه یافته‌اند. به همین دلیل دو فصل از این کتاب به کاربردهای لینوکس و R در بیوانفورماتیک اختصاص داده شده است. امید است که مطالب کتاب حاضر برای دانشجویان به‌ویژه دانشجویان تحصیلات تکمیلی در مقاطع ارشد و دکتری مرتبط با بیوانفورماتیک مفید باشد.

فصل 1: مقدمه

در فصل اول مقدمه‌ای در مورد تاریخچه بیوانفورماتیک، پیشرفت‌ها و توضیحات اولیه‌ای در مورد الزامات علم بیوانفورماتیک توضیح داده شده است.

فصل 2: پایگاه‌های داده

توانایی تولید مثل و تکامل در موجودات زنده توسط ژنوم آنها رهبری می‌شود. به طور معمول ژنوم یک موجود مجموع DNA درون سلول است. از اجزای مهم ژنوم، ژن‌های کد کننده پروتئین‌ها هستند. امروزه توالی‌های DNA، RNA و ژنوم‌ هزاران موجود به طور جزئی یا کامل توالی‌یابی شده‌ است. این امر به ایجاد دوران جدیدی در تولید داده‌های زیستی و اطلاعات ژنومی منجر شده است. بانک‌های داده بیوانفورماتیکی اکنون حاوی میلیاردها نوکلئوتید از توالی DNA مربوط به چندصد هزار گونه مختلف هستند. در فصل اول به معرفی برخی پایگاه‌های داده‌ حاوی این داده‌ها و روش‌هایی برای استخراج اطلاعات از آن‌ها می‌پردازیم.

عناوین مطالب این فصل: پایگاه‌های داده عمده – منابع NCBI – Entrez و BLSAT – جستجو در Entrez – شماره‌ دسترسی توالی‌ها – بانک داده Nucleotide – بانک‏های داده پروتئینی – بانک داده RefSeq – دسترسی به اطلاعات ژن‏ها در Entrez – محدود کردن جستجو در Entrez – جستجو در NCBI از طریق خط فرمان – موسسه بیوانفورماتیک اروپا – پایگاه UniProt – پایگاه ExPASy – پایگاه انسمبل – بیومارت – تمرین

فصل 3: اسید نوکلئیک

بیوانفورماتیک اغلب با تحلیل داده‌های مرتبط با ماکرومولکول‌ها همچون اسیدهای نوکلئیک و پروتئین‌ها سروکار دارد. اسیدهای نوکلئیک از اتصال مولکول‌هایی به نام نوکلئوتید به یکدیگر تشکیل شده‌اند. اگرچه ژنوم اغلب موجودارت از اسید دئوکسی‌ریبونوکلئیک (DNA) تشکیل شده است، بسیاری از ویروس‌ها فاقد DNA بوده و ژنوم آنها از اسید ریبونوکلئیک (RNA) تشکیل شده است. RNA با عملکرد خود (RNA غیر کدکننده) و یا با ترجمه به پروتئین‌ها (mRNA) نقش محوری در عملکردهای بیولوژیکی دارد. علاوه بر mRNA، انواع دیگری از RNA در ژنوم تولید می‌شوند که کد کننده نیستند (به پروتئین ترجمه نمی‌شوند) ولی نقش‌های مهمی را ایفا می‌کنند. اگرچه روش RNAseq برای بررسی بیان ژنها در فصلی مجزا (فصل ‏10) به تفصیل بررسی شده است، در فصل سوم به بررسی جنبه‌های بیوانفورماتیکی انواع مولکول‌های مختلف RNA همچون بانک‌های داده مرتبط با آنها، توالی، فولدینگ و ساختار دوم و سوم به ویژه در RNAهای غیر کدکننده پرداخته می‌شود.

عناوین مطالب این فصل: قالب خواندن – انواع RNA – mRNA – بررسی بیان ژن در سطح mRNA – RNAهای غیرکدکننده – RNAهای غیرکدکننده در بانک داده Rfam – RNA ناقل – RNA ریبوزومی – RNAهای کوچک هسته‏ای – RNAهای کوچک هستکی – میکرو RNA – RNAهای کوچک مداخله‏گر – RNA غیرکدکننده بلند (lncRNA)

فصل 4: پروتئین

هرگاه يك يا چند پلى‌پپتيد پيچ و تاب بخورند و شكل فضايى خاصی به‌وجود بياورند، پروتئين به‌وجود می‌آید. پروتئین‌ها در بسیاری از فرایندهای بیولوژیکی از جمله ساختاری (مانند کراتین در مو و کلاژن در بافت‌های همبند)، انتقال (مانند هموگلوبین که اکسیژن را در خون حمل می‌کند) و سیگنال‌دهی (هورمون‌ها و پروتئین‌های گیرنده) نقش دارند. گروهی از پروتئین‌ها آنزيم‌ هستند و در واكنش‌هاى زیستی دخالت دارند. پروتئین‌ها دارای تنوع بالایی در ساختار و عملکرد هستند و در درک فرایندهای زیستی و ایجاد داروهای جدید نقش کلیدی دارند. فصل چهارم به بررسی واحدهای سازنده پروتئین‌ها یعنی اسیدهای آمینه و ویژگی‌های فیزیکوشیمیایی آنها،  تکامل پروتئین‌ها، ساختار پروتئین‌ها در سطوح مختلف شامل ساختار اول، دوم سوم و چهارم و مفاهیمی همچون موتیف و دمین پروتئینی می‌پردازد. علاوه بر این از آنجا که نقش اصلی پروتئین به ساختار سه بعدی آن وابسته است، سعی می‌شود روش‌های مختلف پیش‌بینی و مشاهده ساختار پروتئین‌ها توضیح داده شود.

عناوین مطالب این فصل: اسیدآمینه‌ – همولوژي، تشابه و یکسانی – دمین و موتیف – موتیف – ویژگی‏های فیزیکی پروتئین‌ – دمین‏های غشاگذر – سیگنال‌ پپتید – هستی‏شناسی ژن‏ها – سازماندهی پروتئین – نقش پروتئین – ویژگی‏های فیزیکوشیمیایی اسيدآمینه‌ – ساختار پروتئین‌ – ارتباط بین توالی و ساختار – ساختار سوم و چهارم پروتئین – بانک داده پروتئین (PDB) – پیش‏بینی ساختار سوم از طریق همولوژی – پیش‏بینی ساختار سوم از ابتدا – ارزیابی دقت ساختارهای سوم حاصل از هوش مصنوعی – پایگاه AlphaFoldDB – داکینگ مولکولی – آشنایی با پایمول – آشنایی با راسمول – تمرین

فصل 5:انطباق دوتایی توالی‏ها

بنيادي‌ترين مرحله در بررسی ساختار و عملكرد یک توالي بیولوژیکی، مقايسه و تطبیق دادن آن با سایر توالي‌های موجود است. انطباق یا همردیفی می‌تواند از طریق چیدن توالی‌ها زیر هم انجام ‌شود ‌طوری‌که نواحی مشابه بین توالی‌ها را مشخص کند. در این صورت، مشاهده درجه معنی‌داری از شباهت توالی مورد نظر با سایر توالی‌ها، می‌توان گفت احتمالاً این توالی‌ها با یکدیگر مرتبط بوده و یا از یک جد مشترک به وجود آمده‌اند و نقش و علمکرد مشابهی دارند. با مقايسه و انطباق توالي‌ها، مي‌توان مناطق حفاظت شده و تغييریافته را تشخيص داد و ساختار و عملكرد توالي‌های ناشناخته را پيشگويي کرد.

عناوین مطالب این فصل: نمودار نقطه‏ای – انطباق دو توالي – ماتریس‏های PAM  – ماتریس‏های BLOSUM – فاصله – انواع انطباق – روش برنامه‏نویسی پویا – انطباق سراسری – انطباق محلی- انطباق توالی‏های نوکلئوتیدی – برنامه BLAST – نحوه کارکرد BLAST – سیستم امتیاز‌دهی – امتیاز انطباق – انواع برنامه‏های BLAST – الگوریتم‏های مختلف BLAST  – BLAST در کامپیوتر شخصی – ایجاد پایگاه داده پروتئینی یا DNA – بلاست علیه دیتابیس ساخته شده – جستجو در دیتابیس‏های آنلاین NCBI – الگوریتم‏های جدید انطباق – تمرین

فصل 6: انطباق چندگانه

انطباق چندگانه به انطباق سه توالی یا بیشتر گفته می‌شود و فرض بر این است که توالی‌ها با یکدیگر همولوگ هستند. نتیجه انطباق، شباهت توالی‌ها را نشان داده و آنالیزهای فیلوژنتیکی را ممکن می‌سازد. در یک انطباق چندگانه واحدهای حفاظت شده زیر هم قرار می‌گیرند، جهش‌های نقطه‌ای در ستون‌هایی نمایان می‌شوند و حذف‌ها با خط تیره مشخص می‌گردند. انطباق چندگانه همچنین اطلاعاتی را در مورد ساختارهای دوم و سوم پروتئین‌ها به‌دست می‌دهد. از سایر کاربردهای انطباق چندگانه می‌توان به مطالعات فیلوژنی و بررسی‌های تکاملی، شناسایی همولوژی، شناسایی بلوک‌های حفاظت‌شده برای طراحی آغازگر یا کاوشگر، تحلیل جهش‌ها و طراحی آزمایشات جهش‌زایی و سرهم‌بندی خوانش‌های توالی‌یابی اشاره کرد. در این فصل سعی می‌شود اصول و روش‌های انجام انطباق چندگانه توضیح داده شود.

عناوین مطالب این فصل: اصول انطباق چندگانه – تکرار – برنامه جال‏ویو – فرمت‏های متداول MSA – الگوی توالی – لوگو – پروفایل – مدل مارکوف مخفی (HMM) – پایگاه‏های داده ترکیبی InterPro و  iProClass – پایگاه‌ Pfam – پایگاه SMART – پایگاه CDD – تمرین

فصل 7: فیلوژنی

چارلز داروین نظریه تکامل درباره منشأ گونه‌ها به‌وسیله  انتخاب طبیعی بیان داشت که تلاش برای بقا باعث انتخاب طبیعی می‌شود. به‌طوری که فرزندان با والدین خود متفاوت هستند و افراد مناسب‌تر برای یک محیط معین انتخاب می‌شوند. به این ترتیب، در طول دوران طولانی، گونه‌ها تغییر یافته و تکامل می‌یابند به‌طوری که فرزندان از نظر ساختاری و عملکردی با اجداد خود متفاوت هستند. لذا تکامل به ایجاد گونه‌های جدید از گونه‌های قبلی از طریق تغییرات قابل توارث و انتخاب طبیعی گفته می‌شود و در این مسیر، انتخاب طبیعی عامل اصلی تکامل است که اشکال ناسازگار را حذف و اشکال سازگار را انتخاب می‌کند. فیلوژنتیک مطالعه روند تکامل موجودات که در آن اجداد و شجره‌نامه معمولا با نمودارهای درختی نشان داده می‌شوند و فیلوژنی الگوی انشعاب روند تکامل و واگرایی تاکسون‌ها را نشان می‌دهد. در سطح مولکولی، تکامل حاصل جهش در نوکلئوتیدها و انتخاب است. فیلوژنی کلاسیک بر مقایسه ویژگی‌های مورفولوژیکی بین موجودات متکی بود در حالی که امروزه از داده‌های مولکولی نیز برای آنالیزهای فیلوژنتیکی استفاده می‌شود. هدف این فصل ارائه اصول و روش‌های فیلوژنی مولکولی است.

عناوین مطالب این فصل: مروری بر ظهور فیلوژنی مولکولی – نرخ جایگزینی نوکلئوتید و زمان انشقاق – انتخاب مثبت یا انتخاب منفی – تئوری خنثی تکامل – فیلوژنی مولکولی و ساختار درخت – ریشه درخت – شکل متنی درخت – تعداد درخت‏های ریشه‏دار و بی‏ریشه – انواع درخت – درخت گونه‏ها در مقابل توالی (ژن یا پروتئین) – درخت براساس پروتئین، DNA یا RNA – مراحل آنالیز فیلوژنی – انطباق چندگانه – مدل‏های تکاملی برای پروتئین و DNA – توزیع نرخ‌ جایگزینی محل‏های مختلف – مقایسه مدل‏ها – انطباق با MAFFT  در لینوکس – ایجاد درخت – روش‏های مبتنی بر فاصله – روش UPGMA – روش اتصال همسایه‏ها – روش حداکثر صرفه‏جویی – مراحل روش حداکثر صرفه‏جویی – روش حداکثر درستنمایی – روش تکامل حداقلی – روش استباط بیزی – ارزیابی درخت – استفاده از مگا برای فیلوژنی – رسم درخت در R – تمرین

فصل 8: واکنش زنجیره‏ای پلیمراز کمی

واکنش زنجیره‌ای پلیمراز یا PCR روشی آزمایشگاهی است که برای تکثیر قطعه مشخصی از DNA به کار می‌رود. این ویژگی کاربردهای وسیعی در تحقیقات ژنتیکی از جمله بررسی ژن‌ها و توالی‌های DNA، بررسی تنوع‌ ژنتیکی، بررسی جهش‌ها و پلی‌مرفیسم و بررسی بیان ژن‌ها دارد و جزء جدایی‌ناپذیر در بیوتکنولوژی و زیست‌شناسی است. از طریق PCR، به‌ویژه PCR کمی (qPCR)، امکان بررسی میزان رونویسی و بیان ژن‌ها وجود دارد. علاوه بر این، PCR برای تأیید یافته‌های حاصل از آزمایش‌های RNAseq استفاده می‌شود، تا دقت پروفایل‌های بیان ژن تولید شده توسط توالی‌یابی را تضمین کند. در این فصل به بررسی اصول qPCR از جمله طراحی آزمایش، طراحی آغازگر و آنالیز داده های حاصل از qPCR پرداخته می‌شود.

عناوین مطالب این فصل: واکنش زنجیره‏ای پلیمراز – واکنش زنجیره‏ای پلیمراز در زمان واقعی – رنگ‏های اتصال به DNA – بررسی بیان ژن با روش qPCR – نکات طراحی آغازگر برای qPCR – طراحی آغازگر – رسم منحنی استاندارد و محاسبه کارایی تکثیر – روش‏های آنالیز داده‏های qPCR – آنالیز بیان ژن از طریق Fold Change – استفاده از R برای آنالیز داده‏های qPCR – تهیه جدول داده‏های ورودی برای بسته rtpcr – بررسی Fold Change (یک ژن و یک تا سه فاکتور) – مثال دوم (یک ژن و یک فاکتور با بیش از دو سطح) – مثال سوم (یک ژن و دو فاکتور) – بررسی Fold Change (چند ژن و یک فاکتور) – بررسی Relative expression (یک ژن و دو فاکتور) – بررسی Relative expression (یک ژن و سه فاکتور) – تمرین

فصل 9: ژنوم

ژنومیکس محاسباتی شاخه‌ای مهم از بیونفورماتیک است. ژنومیکس به توالی‌یابی کل یک ژنوم و شناسایی ژن‌ها و پروتئین‌ها و نقش آنها می‌پردازد، در حالی که ژنومیکس کاربردی از داده‌های ژنومیکس استفاده می‌کند تا نحوه عمل ژن‌ها و پروتئین‌ها را مشخص کند. امروزه با ابداع روش‌های نسل دوم و سوم توالی یابی، هر روزه ژنوم موجودات مختلف در حال توالی‌یابی است. آنچه توالی‌یابی به دست می‌دهد حجم زیادی از خوانش‌های کوتاه از ژنوم است. یکی از چالش‌های بیوانفورماتیک سرهم‌بندی این خوانش‌ها در قالب کروموزوم‌ها، شناسایی ژن‌ها و سایر توالی‌های مرتبط و حاشیه‌نویسی آنها است. در فصل نهم سعی می‌شود با اصول اولیه توالی‌یابی ژنوم، سرهم‌بندی ژنوم و حاشیه‌نویسی ژنها آشنا شویم.

عناوین مطالب این فصل: ساختار ژن در یوکاریوت‏ها – توالی‏یابی ایلومینا – توالی‏یابی Mate-Pair – تولی‏یابی و سرهم‏بندی ژنوم – سرهم‏بندی خوانش‏ها – انطباق خوانش‏ها به ژنوم – انطباق با الکوریتم SSAHA2 – انطباق براساس تبدیل Burrows–Wheeler – سرهم‏بندی ژنوم – حاشیه‏نویسی – فایل GTF یا GFF – فایل BED – دوبرابر شدگی قطعه‏ای – تکرارهای پیاپی – انواع ژن‌ها – یافتن ژن‌های کدکننده در ژنوم‌ یوکاریوتی – پارادوکس ژن‏های کدکننده – سینتنی – تعیین نقش ژن‏ها – روش‏های ژنتیک مستقیم – روش‏های ژنتیک معکوس – تعامل پروتئین-پروتئین – شناسایی اعضای یک خانواده ژنی – رسم نقشه فیزیکی ژن‏ها و ساختار دمین و موتیف پروتئین‏ها – تمرین

فصل 10: ترانسکریپتوم

تکنیک RNASeq توالی‌یابی همه رونوشت‌های یک نمونه RNA است که با استفاده از روش‌های توالی‌یابی جدید انجام می‌شود. تحلیل داده‌های RNASeq توالی مولکول‌های RNA را تعیین و پروفایل بیان ژن‌ها را از طریق شمارش تعداد رونوشت آنها به‌دست می‌دهد. امروزه بررسی بیان ژن‌ها از طریق روش RNAseq قسمت مهمی از بحث‌های ترانسکریپتوم را به خود اختصاص داده است. لذا در فصل دهم اصول تحلیل داده های RNAseq توضیح داده می‌شود. تحلیل داده‌های RNAseq حتی اگر توالی ژنوم رفرنس در اختیار نباشد قابل انجام است و در کل قابلیت شناسایی رونوشت‌ها و ایزوفرم‌های جدید را دارد، مرز بین اگزون/اینترون را در رونوشت‌ها مشخص و لذا ویرایش متناوب را بررسی می‌کند و در صورت وجود، چندشکلی‌های نوکلئوتیدی را در رونوشت‌ها به‌دست می‌دهد.

عناوین مطالب این فصل: طراحی آزمایش – انطباق خوانش‏ها – جهت توالی‏یابی – کنترل کیفیت فایل‏ها و ویرایش خوانش‏ها – مسیر hisat2 و htseq-count – نصب برنامه‏ها و انطباق خوانش‏ها – مشاهده گرافیکی انطباق – شمارش خوانش‏های انطباق‏یافته – نرمال‏سازی توزیع‌ داده‏ها – نرمال‏سازی برای عمق توالی‏یابی و طول ژن‏ها – کاربرد لگاریتم fold change در تحلیل داده‏های RNA-seq – مقدار احتمال تصحیح‏شده – تصحیح بونفرونی – تصحیح بنجامینی‌ هاچبرگ – مراحل انجام روش بنجامینی ‌هاچبرگ – مقایسه آماری بیان ژن‏ها – تمرین

فصل 11: پروتئوم

پروتئوم به کل پروتئین‌های بیان شده یا تمام محصولات ترجمه شده‌ی ژنوم در یک سلول گفته می‌شود. پروتئومیکس به مطالعه‌ی پروتئوم گفته می‌شود که شامل بررسی همزمان همه‌ی پروتئین‌های ترجمه شده در یک سلول می‌باشد. پروتئومیکس دامنه متنوعی از بررسی‌ها نظیر شناسایی و تعیین کمیت پروتئین‌ها در مقیاس زیاد و مشخص کردن محل‌های جایگزینی پروتئین‌ها، تغییرات برهم‌کنش و عملکرد آنها را در بر می‌گیرد. در مقایسه با پروفایل بیانی ژن‌ها، پروتئومیکس مزیت‌های دیگری در بررسی عملکرد ژن‌ها دارد. پروتئومیکس روشی مستقیم برای درک رفتار سلول است چرا که عملکرد ژن عمدتاً توسط پروتئین مشخص می‌شود. بررسی ترانسکریپتوم به‌تنهایی برای بررسی عملکرد سلول کافی نیست زیرا اولا بین mRNAها و پروتئین‌های سلول رابطه‌ یک به یک وجود ندارد، ثانیاً یک ژن یوکاریوتی می‌تواند بدلیل پیرایش متناوب RNA، پروتئین‌های متفاوتی تولید کند. سایر پیچیدگی‌های عملکردی پروتئین‌ها را می‌توان در تغییرات پس از ترجمه، هدف‌گیری پروتئین‌ها و برهم‌کنش‌های آنها یافت. عدم همبستگی mRNA و پروتئین‌ها بدین معنی است که پروتئومیکس می‌تواند اطلاعات بیشتری برای درک عملکرد ژن‌ها در اختیار قرار دهد. در این فصل مباحث اصلی پروتئومیکس مثل شناسایی پروتئین‌ها، بررسی بیان پروتئین، تغییرات پس از ترجمه، گروه‌بندی پروتئین‌ها و تعامل پروتئین-پروتئین با تاکید بر جنبه‌های بیوانفورماتیکی مورد بحث قرار می‌گیرد.

عناوین مطالب این فصل: روش‏های بررسی بیان پروتئین‏ها – ‏2D-PAGE‏ – شناسایی پروتئین‏ها با استفاده از طیف‏سنجی جرمی – شناسایی پروتئین از طریق جستجوی پایگاه‏های داده – الکتروفورز درون‏ژلی تفریقی – مطالعات چند-اومیک

فصل 12: آشنایی با لینوکس

لینوکس به‌عنوان یک سیستم عامل مجانی و قابل توسعه، در بیوانفورماتیک کاربردهای گسترده‌ای دارد. برخی از کاربردهای لینوکس در بیوانفورماتیک عبارتند از: ۱. قابلیت پردازش داده‌های بزرگ و همچنین پشتیبانی از زبان‌های برنامه‌نویسی متعدد مانند R، پایتون و پرل، برای تجزیه و تحلیل‌های بیوانفورماتیکی. ۲. بسیاری از نرم‌افزارهای بیوانفورماتیکی برای لینوکس نوشته می‌شوند و روی این سیستم عامل به خوبی اجرا می‌شوند. ۳. لینوکس با دستورالعمل‌های خط فرمان قدرتمند خود، به کاربران اجازه می‌دهد تا پردازش داده‌ها را به خوبی کنترل کنند. بسته‌های بیوانفورماتیکی زیادی برای مواردی چون بلاست، فیلوژنی، آنالیز DNA، آنالیز داده‌های RNAseq و سایر داده‌های حاصل از توالی‌یابی نسل دوم و سوم، مقایسه ژنوم‌ها و حاشیه‌نویسی ژنوم، برای استفاده در خط فرمان وجود دارند. کاربر می‌تواند از طریق ترمینال لینوکس، دستورات مختلف bash (تحلیل‌گر فرمان در لینوکس و مکینتاش) را تایپ و اجرا کند. همه کسانی که نیاز به کار با داده‌های توالی‌یابی نسل جدید (NGS) دارند، با این سیستم‌عامل آشنا نیستند و به حداقل یک معرفی مختصر در این زمینه نیاز دارند تا دستورات موردنیاز را یاد بگیرند. هدف فصل دوازدهم آشنایی با لینوکس است. پوشش تمام جنبه‌های لینوکس ممکن نیست، اما هدف این است که کاربران بتوانند از ابزارهای معمول بیوانفورماتیکی در لینوکس استفاده کنند.

عناوین مطالب این فصل: نصب WSL در ویندوز 10 – نصب WSL در ویندوز 11 – دستور و فلگ – علامت پایپ – برخی دستورات کاربردی در لینوکس – دستور awk – دستور tr – دستورsed – دستورات فشرده‏سازی – معرفی یک برنامه به PATH در لینوکس – برنامه samtools – برنامه seqkit – ایجاد اسکریپت shell در لینوکس – محیط در لینوکس – ایجاد محیط و نصب بسته‏ها در لینوکس – ذخیره‏کردن محیط – ایجاد محیط در R – استفاده از کانتینر‏های داکر – نمونه‏گیری از فایل‏های paired end – تمرین

فصل 13: آشنایی با R

نرم‌ا‌فزار R از طریق خط فرمان، دستورات را اجرا می‌کند. در فصل‌های قبلی مثال‌هایی از کاربرد R در بیوانفورماتیک مانند انطباق دوتایی (در تمرین‌های صفحه 89)، رسم درخت فیلوژنی (صفحه 141) و رسم لوگو (صفحه 101) ذکر شده است. در فصل سیزدهم سعی می‌شود خواننده با توابع پایه در R آشنا شود و نحوه استفاده از آن‌ها را فراگیرد. با این حال برای یادگیری بیشتر، نیاز به مراجعه به راهنمای توابع مختلف و همچنین منابعی است که به‌طور ویژه به آموزش R پرداخته‌اند.

عناوین مطالب این فصل: نصب و اجرای برنامه – عملیات ریاضی ساده – متغیر – توابع – انواع داده در R – بردار – ایجاد بردار‏های منظم – ماتریس – ماتریس واحد – ضرب ماتریس در یک مقدار ثابت – برگردان ماتریس – عکس ماتریس – ساختار داده – لیست – آرایه – نصب و بارگذاری پکیج‏ها – استخراج زیرمجموعه‏ای از جدول – جستجوی متن با‌grep – تعریف پوشه کاری – فراخوانی داده‏ها از فایل و ذخیره کردن جدول‌ – توصیف داده‏ها – توابع خانواده apply – تابع apply – تابع lapply – تابع sapply – تابع tapply – استفاده از توابع group_by و summarise – مصورسازی در R – برنامه‏نویسی در R – حلقه‌ – ایجاد تابع – معرفی بایوپایتون برای بیوانفورماتیک – تمرین