02/06/2025
জানেন কি ? চ্যাটজিপিটি কিভাবে যেকোনো ছবি Ghibli Anime স্টাইলে পরিণত করে ! এর পিছনের টেকনিক্যাল যাদুটা কী ?
বর্তমান যুগে ChatGPT শুধুমাত্র লেখালেখির সহকারী নয়, বরং আপনার ছবি থেকে কল্পনাজগতের একটি মায়াবী Ghibli Anime Scene তৈরি করতেও সক্ষম। তবে প্রশ্ন হচ্ছে, এই জাদু আসলে ঘটে কীভাবে? 🤔 আজকের এই পোস্টে আমরা জানবো সেই পেছনের গোপন রহস্য 🪄🕴️
📌চ্যাটজিপিটি ছবি ইনপুট হিসেবে কীভাবে গ্রহণ করে?🤔
চ্যাটজিপিটির কিছু ভার্সনে (যেমন GPT-4 Turbo with Vision) আপনি সরাসরি একটি ছবি আপলোড করতে পারেন। এটি ছবিটিকে “visual input” হিসেবে নেয়।
ChatGPT নিজে ছবি প্রসেস করতে পারে না, তবে এটি অন্য একটি শক্তিশালী AI মডেল ব্যবহার করে, যেমন:
📍DALL·E – এটি একটি Text-to-Image মডেল যা টেক্সট ইনপুট থেকে ছবি তৈরি করতে পারে।
📍CLIP (Contrastive Language–Image Pretraining) – এটি ছবি ও টেক্সটের মধ্যে সম্পর্ক বোঝে। এটি ChatGPT কে সাহায্য করে বোঝাতে: “এই ছবিতে কী আছে?”
আপনি যখন একটি ছবি আপলোড করেন, ChatGPT ওই ছবিকে এনালাইস করে এবং একটি টেক্সট বর্ণনা (caption বা feature summary) তৈরি করে। এরপর সে বর্ণনাটিকে Ghibli স্টাইলে রূপ দিতে DALL·E বা অন্য ইমেজ জেনারেটরকে কমান্ড দেয়।
📌ছবি প্রসেসিংয়ের ধাপগুলো কী কী?
ধাপ ১: ইমেজ এনালাইসিস (Image Analysis)
আপনার আপলোড করা ছবির মূল উপাদানগুলো AI শনাক্ত করে, যেমন লোক, জায়গা, বস্তু, কালার প্যাটার্ন ইত্যাদি।
ধাপ ২: স্টাইল ট্রান্সফার কমান্ড
এরপর আপনি যখন বলেন “Ghibli Style”-এ রূপান্তর করো, তখন ChatGPT একধরনের ইমেজ প্রম্পট তৈরি করে। যেমন:
“A dreamy animated version of the uploaded photo, in the style of Studio Ghibli, with soft colors, watercolor textures, whimsical background…”
ধাপ ৩: ইমেজ জেনারেশন
DALL·E বা অনুরূপ ইমেজ মডেল প্রম্পটের উপর ভিত্তি করে এক বা একাধিক Ghibli স্টাইলের ছবি তৈরি করে। এর সবটাই ঘটে কয়েক সেকেন্ডের মধ্যে!
📌Ghibli স্টাইল AI কীভাবে বুঝে?
Ghibli Studio এর আর্টস্টাইল AI শিখেছে লক্ষ লক্ষ অ্যানিমে আর্টওয়ার্ক ও বর্ণনার মাধ্যমে। এই স্টাইলে কিছু নির্দিষ্ট বৈশিষ্ট্য থাকে, যেমন:
📝 Soft lighting ও dreamy feel
📝 Hand-painted বা watercolor টেক্সচার
📝 Magical বা whimsical ব্যাকগ্রাউন্ড
📝 বড় বড় expressive চোখ
📝 হালকা সবুজ, নীল, সোনালী রঙের ব্যবহার
AI যখন প্রম্পটে “Ghibli style” শব্দটা পায়, তখন সেই শিখে রাখা বৈশিষ্ট্যগুলোর ভিত্তিতে একটি মডেল ছবি আঁকে।
📌এইসব প্রযুক্তির মধ্যে কে কে কাজ করে?
📎GPT-4 Vision: ছবি থেকে টেক্সট ইনফারেন্স করতে সাহায্য করে
📎CLIP Model: ছবি ও টেক্সটের মিল খুঁজে বের করে
📎DALL·E 3: Ghibli স্টাইল অনুযায়ী ছবি তৈরি করে
📎ChatGPT Interface: সবকিছুকে সহজভাবে আপনার কাছে উপস্থাপন করে
✅উদাহরণস্বরূপ এই প্রসেস টা দেখতে পারেন:
ধরুন , নিয়নবাইটস এর লোগো সহ একটি পাহাড়ে দাঁড়িয়ে থাকা একটি ছবি দিলেন চ্যাটজিপিটিকে। আপনি ইনপুট দিলেন:
“এই ছবিটিকে Studio Ghibli movie scene এর মতো dreamy অ্যানিমে স্টাইলে রূপান্তর করো।”
📌চ্যাটজিপিটি ভিতরে ভিতরে যা করবে:
🔎 ছবিটি দেখে সে বুঝবে : “এই ছবিতে একজন মানুষ পাহাড়ে দাঁড়িয়ে, দূরে আকাশ, কিছু মেঘ। সাথে নিয়নবাইটস এর লোগো”
🔎 তৈরি করে এইরকম প্রম্পট:
“A dreamy anime-style image of a person standing on a mountain with soft lighting and NeonBytes logo at corner, watercolor textures, and Studio Ghibli background with clouds and golden sunlight.”
🔎 এই প্রম্পট পাঠায় DALL·E 3-কে।
🔎 DALL·E সেই অনুযায়ী একটি সম্পূর্ণ নতুন, Ghibli-styled চিত্র আঁকে।
শেষ কথা:
এটা কেবল প্রযুক্তির চমক নয়, এটা কল্পনার রূপান্তর। চ্যাটজিপটি ও DALL·E-এর সমন্বয়ে আপনি এখন নিজেই নিজের অ্যানিমে জগৎ তৈরি করতে পারেন, তাও আবার সেটা Studio Ghibli-এর মতো পিউর আর্টস্টাইলে!
আপনি যদি এরকম টেক রিলেটেড ইনফরমেটিভ পোস্ট পড়তে চান তবে আমাদের পেজটি ঘুরে আসতে পারেন । এবং পরবর্তী পোস্ট পেতে পেজটি ফলো করে রাখতে পারেন ❤️