19/09/2025
Anova নিয়ে এতো সুন্দর লেখা খুব কমই পড়েছি, যাবির ভাই এত সুন্দর করে লিখেছেন! পড়তে পারেন
ভাবো তুমি আর তোমার কয়েকজন চা পাগল বন্ধু বান্ধবী একদিন নতুন একটা রেস্টুরেন্টে গেলে। সেখানে চা দোকানি ভদ্রলোক দুধ চা, লেবু চা আর গ্রিন টি এই তিন ধরনের চা বিক্রি করেন। সবাই মিলে তিন রকম চা খেল এবং প্রত্যেকে রেটিং দিল। তুমি যেহেতু একটু বেশিই চিন্তা ভাবনা করো তাই তোমার মাথায় প্রশ্ন তৈরি হলো। এই তিন ধরনের চায়ের স্বাদ কি আসলেই আলাদা? নাকি শুধু কারো রুচির তারতম্যের (taste preference variation) কারণে গড় (average) রেটিং একটু এদিক সেদিক হয়েছে?
যদি শুধু গড় (mean) দেখি, হয়তো দেখা গেল দুধ চায়ের গড় রেটিং ৭.৫, লেবু চায়ের ৮, আর গ্রিন টির ৭। মনে হচ্ছে লেবু চা সেরা। কিন্তু যদি ডেটার ভেতরে গিয়ে দেখলে, লেবু চায়ের কেউ ১০ দিয়েছে আবার কেউ ৫ দিয়েছে। মানে ডেটার ভেতরে অনেক ভ্যারিয়েশন আছে। তাহলে শুধু গড় দেখে নিশ্চিত হওয়া যায় না যে লেবু চা সত্যিই অন্যদের থেকে ভালো।
এখানেই আসে ANOVA (Analysis of Variance)। ANOVA শুধু গড় দেখে না, বরং দেখে প্রতিটি চায়ের ভেতরে রেটিং ও কতটা ভ্যারিয়েশন আছে (within-group variation/dispersion), আর চাগুলোর মধ্যে যে পার্থক্য (between-group difference) দেখা যাচ্ছে সেটা আসলেই গুরুত্বপূর্ণ (statistically significant) কি না, নাকি কেবল কাকতালীয় (random chance)।
এখন ধরো এখানে আমরা শুধু চায়ের ধরন (type of tea) নিয়েই বিচার করছি, দুধ চা, লেবু চা আর গ্রিন টি। অন্য কোন ফ্যাক্টর বিবেচনা করছি না (যেমন আবহাওয়ার বা জেন্ডারের কারণে কোন পার্থক্য হচ্ছে কিনা)। তখন এটাকে বলা হবে One-way ANOVA, কারণ একটিমাত্র ফ্যাক্টর (single factor) বা কারণকে ভিত্তি করে তুলনা করা হচ্ছে।
কিন্তু যদি তুমি আরও গভীরে গিয়ে দেখতে চাও, যেমন ছেলেরা আর মেয়েরা চায়ের রেটিং দেওয়ার ক্ষেত্রে ভিন্ন আচরণ (different pattern) করছে কি না, তাহলে আরেকটা ফ্যাক্টর (factor) যোগ হলো। এখন দুইটা বিষয় একসাথে কাজ করছে। একটা হলো চায়ের ধরন, আরেকটা হলো জেন্ডার। তখন যেটা ব্যবহার করতে হবে সেটাকে বলা হয় Two-way ANOVA।
Two-way ANOVA শুধু চায়ের ধরন আলাদা করছে কি না তা-ই বলে না, বরং লিঙ্গভেদে রেটিংয়ে পার্থক্য আছে কি না, এমনকি ছেলেরা ও মেয়েরা কি একইভাবে সব চায়ের স্বাদ বিচার করছে নাকি তাদের প্রতিক্রিয়ায় ভিন্নতা (interaction effect) আছে, সেটাও দেখায়। যেমন, ছেলেরা যদি দুধ চা (milk tea) বেশি পছন্দ করে আর মেয়েরা যদি লেবু চা (lemon tea) বেশি পছন্দ করে, তবে এটাকে বলা হয় interaction effect।
এবার ধরো তোমার কৌতূহল আরও বাড়ল। তুমি শুধু চায়ের ধরন আর জেন্ডার নিয়েই সন্তুষ্ট হলে না, তুমি ভাবলে সকাল, বিকেল আর রাতের সময় (time of day) ভেদেও কি রেটিংয়ের পার্থক্য হয়? হয়তো সকালের নাশতায় দুধ চা ভালো লাগে, বিকেলে লেবু চা ফ্রেশ লাগে, আর রাতে গ্রিন টি খেতে স্বস্তি দেয়। এখন আবার নতুন একটি ফ্যাক্টর যোগ হলো, সময়।
এই অবস্থায় তিনটা ফ্যাক্টর একসাথে দেখা হচ্ছে। চায়ের ধরন, জেন্ডার, আর সময়। তখন এটাকে বলা হবে Three-way ANOVA। আর যদি আরও ফ্যাক্টর যোগ করো, যেমন, চায়ের কাপের আকার (small/large), অথবা চিনি দেওয়া হয়েছে কি হয়নি তাহলে সেটাকে সাধারণভাবে বলা হবে Factorial ANOVA বা N-way ANOVA (যেখানে N মানে কত ফ্যাক্টর আছে সেটা বোঝাচ্ছে)।
এই ধরণের বিশ্লেষণ শুধু প্রতিটি ফ্যাক্টরের প্রভাব আলাদা করে জানায় না, বরং এগুলো একসাথে মিলে কেমন নতুন প্রভাব তৈরি করছে (complex interaction effect), সেটাও জানিয়ে দেয়। তাই যত বেশি ফ্যাক্টর যোগ হয়, ANOVA ততটাই শক্তিশালীভাবে বাস্তব জীবনের জটিল পার্থক্যগুলোকে বিশ্লেষণ করতে পারে।
সবশেষে বলা যায়, ANOVA (Analysis of Variance) আসলে এমন এক পরিসংখ্যানিক হাতিয়ার, যা আমাদের চোখে দেখা গড়ের পার্থক্যকে বৈজ্ঞানিকভাবে যাচাই করতে সাহায্য করে। শুধু গড় মান দেখলেই মনে হতে পারে যে একটি চা বা একটি গ্রুপ অন্যদের চেয়ে ভালো বা খারাপ, কিন্তু ডেটার ভেতরে থাকা ভ্যারিয়েশন বা ওঠানামা না বোঝা গেলে সেই সিদ্ধান্ত ভুল হতে পারে। ANOVA এই জায়গাতেই সবচেয়ে কার্যকর। এটা বলে দেয় পার্থক্যটা সত্যিই গুরুত্বপূর্ণ নাকি কেবল কাকতালীয়।
© Abdullah Al Zabir