ডিজিটেল ডেস্কঃ গুগলৰ কৃত্ৰিম বুদ্ধিমত্তা (AI) লেব DeepMind-এ প্ৰৱৰ্তন কৰিছে ‘VEO2’ নামৰ এটা নতুন ভিডিঅ’ সৃষ্টিকাৰী এআই ৷ ই OpenAIৰ Soraতকৈ অধিক সক্ষম, কিয়নো 'VEO2' য়ে 4K ৰিজ'লিউচনত ২ মিনিটতকৈ অধিক সময়ৰ ক্লিপ তৈয়াৰ কৰিব পাৰে, আনহাতে Sora য়ে মাত্ৰ 1080p আৰু ২০ ছেকেণ্ডলৈকে ভিডিঅ' তৈয়াৰ কৰিব পাৰে।
কিন্তু বৰ্তমান গুগলৰ ভিডিঅ’-এফএক্সত ‘VEO2’ ব্যৱহাৰ কৰা হৈছে, ভিডিঅ’সমূহ 720p আৰু ৮ ছেকেণ্ডৰ দৈৰ্ঘ্যত সীমাবদ্ধ।
লিখনি আৰু ছবিৰ পৰাও ভিডিঅ’ প্ৰস্তুত কৰিব পাৰে এই কৃত্ৰিম বুদ্ধিমত্তাই
ডিপমাইণ্ডৰ উপ-সভাপতি এলি কলিন্সে কয় যে ‘VEO2’ বৃহৎ পৰিসৰৰ ব্যৱহাৰৰ বাবে সাজু হ’লে গুগলৰ ভাৰ্টেক্স এআই প্লেটফৰ্মত উপলব্ধ কৰা হ’ব।
'VO2'-এ লিখনি আৰু ছবিৰ পৰা ভিডিঅ' তৈয়াৰ কৰিব পাৰে, উন্নত পদাৰ্থ বিজ্ঞানৰ বুজাবুজি আৰু কেমেৰা নিয়ন্ত্ৰণৰ সৈতে।
ই প্ৰকৃত গতি, তৰল গতিবিদ্যা আৰু চিনেমাৰ প্ৰভাৱ চম্ভালিব পাৰে, কিন্তু জটিল প্ৰমপ্ট আৰু দীঘলীয়া ভিডিঅ’ত প্ৰত্যাহ্বানসমূহ স্থিৰতা আৰু সঠিকতাত থাকে।
ডিপমাইণ্ডে ড’নাল্ড গ্লভাৰ আৰু দ্য উইকেণ্ডৰ দৰে শিল্পীৰ সৈতে সহযোগিতা কৰি নিজৰ মডেল উন্নত কৰিছিল। ‘VO2’ক প্ৰশিক্ষণ দিবলৈ হাজাৰ হাজাৰ ভিডিঅ’ ব্যৱহাৰ কৰা হৈছিল যদিও তথ্যৰ উৎসৰ বিষয়ে প্ৰকাশ কৰা হোৱা নাছিল।
সুৰক্ষাৰ বাবে ইয়াত প্ৰমপ্ট-লেভেল ফিল্টাৰ আৰু ডিপফেকৰ দৰে বিপদ হ্ৰাস কৰিবলৈ চিন্থআইডি ৱাটাৰমাৰ্কিং প্ৰযুক্তি আছে। ইয়াৰ উপৰিও ইমেজেন ৩ মডেলত ফটোৰিয়েলিজম আৰু এনিমে শৈলীত উন্নত ছবিৰ গঠন আৰু বিৱৰণ সন্নিৱিষ্ট আছে।