کلاستر
روشهای آماری چند متغیره (بیومتری )
روش آماری چند متغیره[1]
با افزایش انداره های نمونه مواد اصلاحی و داخل ژرم پلاسم ها که برای برنامه توسعه گیاهان استفاده می شود. روشهای طبقه بندی و ترتیب تغییر پذیری ژنتیکی بطور معنی داری مورد توجه قرار می گیرد.استفاده از روشهای آماری چند متغیره استراتژی مهمی برای طبقه بندی ژرم پلاسم، مرتب کردن تغییر پذیری برای تعداد بسیاری از نمونه ها یا ارزیابی روابط ژنتیکی بین مواد مورد مطالعه است . تکنیک ها یآماری چند متغیره که بطور همزمان اندازه گیری های چند گانه روی هریک از افراد مورد مطالعه را ارزیابی می کند ، بطور گسترده ای در ارزیابی تنوع ژنتیکی ، صرف نظر از نوع داده ها ( مورفولوژیکی ، بیوشیمیایی یا داده ها ی ملکولی ) استفاده می شود . از میان این روشها می توان به تجزیه کلاستر ( خوشه ای ) ، تجزیه به مولفه های اصلی و... بسیار معمول بوده و مورد استفاده قرار می گیرند.( Melchinger ,1993 ; Johns et al .,1997; Thompson et al.,1998; Brown-Guedira.et al .,2000.).
تجزیه کلاستر
تجزیه کلاستر " یک گروهی از تکنیک های چندمتغیره که درابتدا هدف آن گروهبندی افراد یا مواد براساس صفات آنها ست ،سپس افرادبا صفات مشابه را با زبان ریاضی در یک خوشه
قرارمی دهد." در تجزیه کلاستر افرادداخل یک کلاستر بیشترین شباهت و یکنواختی را دارند و بین کلاستر ها حداکثر تفاوت و غیر یکنواختی وجود دارد.بنابراین اگر گروهبندی موفقیت آمیز باشد. اجزاءیا افراد داخل کلاستر در صورت ترسیم نمودار از لحاظ ژنتیکی بهم نزدیکترند .وکلاسترهای دورتر متفاوترخواهند بود. (Hair et al .,1995).
بطور کلی ازمیان روشهای متنوع گروهبندی ، روش مبتنی بر فاصله که در این روش ماتریس فاصله بعنوان ورودی جهت ارزیابی با یک الگوریتم گروهبندی خاص استفاده می شود.(Johnson and Wichern,.1992).بیشتر کاربرد دارد ونتایج به شکل گرافیکی بصورت شجره ای یا دندروگرام مشخص می شود و کلاستر ها با نگاه به شکل شناخته می شوند .
ازروشهای معمول مورد استفاده در ارزیابی های تنوع ژنتیکی می توان بطور خلاصه به موارد ذیل اشاره کرد که بیشترین کاربرد را دارند .
1. UPGMA Unweigthed Paired Group Method ; (Sneath and Sokal,1973.).
2. WARD Ward’s Minimum Variance method ; . (Ward,1963.)
یکی از جنبه های مهم تجزیه کلاستر تعیین تعداد کلاستر مطلوب و قابل قبول است . دراصل درستی آن درگرو این تصمیم است که از کجا برش دندروگرام برای پیدا کردن گروههای واقعی انجام شود . یک کلاستر زمانی مورد قبول است که یک یا چند گروه یا ژنوتیپ ها متفاوت ، فاصله ژنتیکی درون کلاستری آنها کمتر از میانگین کل فاصله ژنتیکی باشد . وفاصله ژنتیکی بین دوکلاستر از فاصله درون کلاستری آنها بیشتر باشد . ( Brown-Guedria et al ,.2000) .البته در این رابطه نظرات دیگری نیز وجود دارد که به آنها پرداخته نمی شود.
تجزیه به مؤلفه های اصلی [2]
این تجزیه در واقع به تقسیم بندی افراد دردیاگرام پراکنش دو یا سه بعدی کمک می کند بطوریکه فاصله هندسی بین افراد در دیاگرام ، باحداقل انحراف ، به فاصله ژنتیکی آنها بر می گردد.
تجمع افراد در چنین نمودار می تواند مبین تشابه ژنتیکی درستی از مجموعۀ افراد باشد . (Melchinger ,1993; Karp et al .,1997; Worburton and Crossa ,2000)
تجزیه به مؤلفه های اصلی بعنوان یک روش کاهش داده ها جهت وضوح روابط بین دو یا بیش از دو صفت به تعداد متغیرهای محدود غیر همبسته نیز شناخته می شود .(Wiley ,1981) همچنین این تجزیه اجازه خواهد داد که تفاوتهای بین افراد را تصور، و گروههای ممکنه را شناسائی نمائیم .
کاهش داده ها توسط تبدیل متغیرها به روابط خطی داده های اصلی به متغیرهای جدید غیر همبسته که تحت عنوان " مؤلفه های اصلی " شناخته می شوند ، انجام می شود. در این تجزیه قدم اول محاسبۀ ریشه های راکد [3] است که مقدار کل تغییرات را روی محور مؤلفه های اصلی نشان می دهد . مؤلفه اول بیشترین مقدار تغییرات را در بر می گیرد . اولین مؤلفه بیشترین تغییر پذیری موجود در داده های اصلی را بیان می کند و بقیه آن درمؤلفه های بعدی قرار می گیرد . بدین ترتیب دومین مؤلفه ، حداکثر تغییر پذیری را که توسط مؤلفۀ اول بیان نشده وبا آن همبستگی نداشته را بیان می کند و به همین شکل مؤلفۀ های بعدی
قرار می گیرند . (Jolliffe,1986) .اين به آن دليل است كه مؤلفه ها نسبت به هم متعامد هستند .هر مؤلفه بخش متفاوتي از تغييرات تغييرات داده هاي اصلي را نشان مي دهد . وممكن است بطور مستقل تفسير شود و بدين ترتيب كل تغييرات داده هاي اصلي به مؤلفه هايي كه حالت تجمعي دارند تقسيم مي شود.و سهم هريك از مؤلفه ها در تغييرات، ازتقسيم آن به مجموع آنها (ريشه هاي راكد ) بيان مي شود.