
23/09/2025
⏺️ বিস্তার (𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧) এবং বিস্তার পরিমাপ ( 𝐌𝐞𝐚𝐬𝐮𝐫𝐞 𝐨𝐟 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧) ডেটাসেটের বৈচিত্র্য বোঝার জন্য গুরুত্বপূর্ণ। এটি ডেটার বিস্তৃতি এবং বিভাজন সম্পর্কে একটি পরিষ্কার ধারণা দেয়। বিভিন্ন ধরনের বিস্তার পরিমাপ বিভিন্ন পরিস্থিতিতে ব্যবহৃত হয়, যা ডেটা বিশ্লেষণে অত্যন্ত কার্যকর।
✅ বিস্তার (𝐑𝐚𝐧𝐠𝐞)
বিস্তার হলো একটি ডেটাসেটের সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য। এটি ডেটাসেটের বিভিন্নতার একটি সহজ পরিমাপ এবং ডেটার বিতরণের প্রাথমিক ধারণা দেয়।
উদাহরণ:
ডেটাসেট: 5, 10, 15, 20, 25, 30
বিস্তার: 30 - 5 = 25
✅ বিস্তার পরিমাপ (𝐌𝐞𝐚𝐬𝐮𝐫𝐞 𝐨𝐟 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧)
বিস্তার পরিমাপ ডেটাসেটের মানগুলোর ছড়িয়ে পড়ার মাত্রা বা ডেটা কতটা ছড়ানো তা বোঝায়। এটি মূলত ডেটাসেটের বৈচিত্র্য এবং স্থিতি নির্ধারণে ব্যবহৃত হয়।
ডেটা বিশ্লেষণে বিস্তার পরিমাপ অত্যন্ত গুরুত্বপূর্ণ, কারণ এটি ডেটার গুণমান এবং স্থিতিশীলতার ধারণা দেয়।
📑 বিস্তার পরিমাপের প্রকারভেদ (𝐓𝐲𝐩𝐞𝐬 𝐨𝐟 𝐌𝐞𝐚𝐬𝐮𝐫𝐞𝐬 𝐨𝐟 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧)
বিস্তার পরিমাপ প্রধানত দুটি ভাগে বিভক্ত:
১. সহজ বিস্তার পরিমাপ (𝐀𝐛𝐬𝐨𝐥𝐮𝐭𝐞 𝐌𝐞𝐚𝐬𝐮𝐫𝐞 𝐨𝐟 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧)
এটি ডেটাসেটের বাস্তব পরিমাপ ব্যবহার করে বিস্তার নির্ণয় করে। সাধারণত এই ধরনের পরিমাপ ডেটাসেটের বিভিন্নতার সঠিক মান প্রকাশ করে। এর প্রধান প্রকারগুলো হলো:
ক. বিস্তার (𝐑𝐚𝐧𝐠𝐞):
সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য।
𝐑𝐚𝐧𝐠𝐞 = 𝐌𝐚𝐱𝐢𝐦𝐮𝐦 𝐕𝐚𝐥𝐮𝐞 -𝐌𝐢𝐧𝐢𝐦𝐮𝐦 𝐕𝐚𝐥𝐮𝐞
খ. আন্তঃচতুর্থাংশ বিস্তার (𝐈𝐧𝐭𝐞𝐫𝐪𝐮𝐚𝐫𝐭𝐢𝐥𝐞 𝐑𝐚𝐧𝐠𝐞):
ডেটাসেটের ৭৫তম শতাংশক (Q3) এবং ২৫তম শতাংশক (Q1)-এর মধ্যে পার্থক্য।
IQR = Q3 - Q1
গ. চতুর্ভাগীয় বিচ্যুতি (𝐐𝐮𝐚𝐫𝐭𝐢𝐥𝐞 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧):
চতুর্ভাগীয় বিচ্যুতি (Quartile Deviation) হলো একটি ডেটাসেটের মধ্যবর্তী ৫০% ডেটার বিস্তার বা বিক্ষেপের পরিমাপ, যা প্রথম চতুর্থাংশ (Q1) এবং তৃতীয় চতুর্থাংশ (Q3) এর গড় পার্থক্য। একে সেমি-ইন্টারকোয়ার্টাইল রেঞ্জও বলা হয়। ডেটাসেটের চরম মানের প্রতি এটি কম সংবেদনশীল এবং ডেটার কেন্দ্রীয় অংশ সম্পর্কে জানতে সাহায্য করে।
সূত্র
চতুর্ভাগীয় বিচ্যুতি নির্ণয়ের সূত্রটি হলো:
QD = (Q3 - Q1) / 2
ঘ. গড় বিচ্যুতি (𝐌𝐞𝐚𝐧 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧):
ডেটাসেটের প্রতিটি মানের গড় থেকে বিচ্যুতির গড়।
২. আপেক্ষিক বিস্তার পরিমাপ (𝐑𝐞𝐥𝐚𝐭𝐢𝐯𝐞 𝐌𝐞𝐚𝐬𝐮𝐫𝐞 𝐨𝐟 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢𝐨𝐧)
আপেক্ষিক বিস্তার পরিমাপ ডেটার বিভিন্নতার তুলনামূলক মাত্রা নির্দেশ করে এবং এটি সাধারণত শতাংশে প্রকাশিত হয়। এর প্রধান প্রকারগুলো হলো:
ক. আপেক্ষিক গড় বিচ্যুতি (𝐑𝐞𝐥𝐚𝐭𝐢𝐯𝐞 𝐌𝐞𝐚𝐧 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧):
গড় বিচ্যুতিকে গড়ের সাথে তুলনা করে নির্ণয় করা হয়।
খ. আপেক্ষিক চতুর্ভাগীয় বিচ্যুতি (𝐑𝐞𝐥𝐚𝐭𝐢𝐯𝐞 𝐐𝐮𝐚𝐫𝐭𝐢𝐥𝐞 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧):
আপেক্ষিক চতুর্ভাগীয় বিচ্যুতি (Relative Quartile Deviation) হলো একটি ডেটাসেটের বিস্তার পরিমাপের একটি পদ্ধতি, যা ডেটাসেটের মধ্যক চতুর্থাংশ (Median-Q_median) থেকে ডেটার বিস্তারকে শতাংশের মাধ্যমে প্রকাশ করে। এটি ডেটাসেটের মানগুলোর আপেক্ষিক ভিন্নতা বুঝতে সাহায্য করে।
গণনার পদ্ধতি
আপেক্ষিক চতুর্ভাগীয় বিচ্যুতি নির্ণয় করা হয় নিম্নলিখিত সূত্রটি ব্যবহার করে: RQD = (Q₃ - Q₁) / ((Q₃ + Q₁) / 2) * 100%
যেখানে: Q₃: ডেটাসেটের তৃতীয় চতুর্থাংশ (Upper Quartile), Q₁: ডেটাসেটের প্রথম চতুর্থাংশ (Lower Quartile), Q₃ - Q₁: চতুর্থাংশীয় বিচ্যুতি (Quartile Deviation).
গ. আপেক্ষিক মান বিচ্যুতি (𝐑𝐞𝐥𝐚𝐭𝐢𝐯𝐞 𝐒𝐭𝐚𝐧𝐝𝐚𝐫𝐝 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧):
আপেক্ষিক মান বিচ্যুতি বা আপেক্ষিক আদর্শ বিচ্যুতি (𝐑𝐞𝐥𝐚𝐭𝐢𝐯𝐞 𝐒𝐭𝐚𝐧𝐝𝐚𝐫𝐝 𝐃𝐞𝐯𝐢𝐚𝐭𝐢𝐨𝐧 বা RSD) হলো একটি পরিসংখ্যানগত পরিমাপ, যা কোনো ডেটাসেটের গড় মানের তুলনায় তার মান বিচ্যুতির বিস্তৃতি কতটুকু, তা প্রকাশ করে। এটি সাধারণত শতাংশে প্রকাশ করা হয় এবং কোএফিসিয়েন্ট অফ ভ্যারিয়েশন (𝐂𝐨𝐞𝐟𝐟𝐢𝐜𝐢𝐞𝐧𝐭 𝐨𝐟 𝐕𝐚𝐫𝐢𝐚𝐭𝐢𝐨𝐧 বা 𝐂𝐕) নামেও পরিচিত।
ডেটাসেটের মান বিচ্যুতিকে গড় বা মধ্যকের সাথে তুলনা করা হয়।
✅ বিস্তার পরিমাপের গুরুত্ব
১. ডেটাসেটের বৈচিত্র্য এবং স্থিতি নির্ধারণে সহায়তা করে।
২. বিভিন্ন ডেটাসেটের তুলনা করতে ব্যবহৃত হয়।
৩. গাণিতিক বিশ্লেষণে ডেটাসেটের স্থায়িত্ব যাচাই করা যায়।
৪. ডেটার চরম মান শনাক্তে সহায়তা করে।
#তথ্য