সারসংক্ষেপ
যদিও ডিপ লার্নিংয়ের ঐতিহাসিক শিকড় দশকগুলো পিছনে extends, 'ডিপ লার্নিং' শব্দটিও না পদ্ধতিটিও জনপ্রিয় ছিল মাত্র পাঁচ বছর আগে, যখন ক্ষেত্রটি Krizhevsky, Sutskever এবং Hinton-এর এখন ক্লাসিক ২০১২ সালের Imagenet-এর ডিপ নেট মডেলের মতো গবেষণাপত্র দ্বারা পুনরায় প্রজ্বলিত হয়েছিল। পরবর্তী পাঁচ বছরে ক্ষেত্রটি কী আবিষ্কার করেছে? স্পিচ রিকগনিশন, ইমেজ রিকগনিশন এবং গেম খেলার মতো ক্ষেত্রে যথেষ্ট অগ্রগতির পটভূমিতে, এবং গণমাধ্যমে ব্যাপক উত্সাহের মধ্যে, আমি ডিপ লার্নিংয়ের জন্য দশটি উদ্বেগ উপস্থাপন করছি, এবং পরামর্শ দিচ্ছি যে আমাদের যদি আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্সে পৌঁছাতে হয় তবে ডিপ লার্নিংকে অবশ্যই অন্যান্য প্রযুক্তি দ্বারা পরিপূরক করতে হবে।
ভূমিকা: ডিপ লার্নিং কি একটি প্রাচীরের কাছে পৌঁছাচ্ছে?
ডিপ লার্নিং, তার সাম্প্রতিক জনপ্রিয়তা বিস্ফোরণ সত্ত্বেও, এর ঐতিহাসিক শিকড় দশক পিছনে প্রসারিত। ক্ষেত্রটি তুলনামূলকভাবে কম নোটিশ আকর্ষণ করেছিল মাত্র পাঁচ বছর আগে পর্যন্ত যখন ২০১২ সালে সবকিছু পরিবর্তন হয়েছিল অত্যন্ত প্রভাবশালী গবেষণাপত্র যেমন Krizhevsky, Sutskever এবং Hinton-এর 'ImageNet Classification with Deep Convolutional Neural Networks' প্রকাশের সাথে, যা ImageNet নামক অবজেক্ট রিকগনিশন চ্যালেঞ্জে state-of-the-art ফলাফল অর্জন করেছিল।
বছর শেষ হওয়ার আগেই, ডিপ লার্নিং The New York Times-এর প্রথম পৃষ্ঠায় স্থান পেয়েছিল, এবং এটি দ্রুত Artificial Intelligence-এর সবচেয়ে সুপরিচিত টেকনিক হয়ে উঠল, অনেকটা ব্যবধানে। যদিও একাধিক লেয়ার নিয়ে নিউরাল নেটওয়ার্ক ট্রেন করার সাধারণ ধারণাটি নতুন ছিল না, কম্পিউটেশনাল পাওয়ার এবং ডেটা প্রাপ্যতা বৃদ্ধি ডিপ লার্নিংকে প্রথমবারের মতো সত্যিকারভাবে ব্যবহারিক করে তুলেছিল।
ডিপ লার্নিং তারপর থেকে স্পিচ রিকগনিশন, ইমেজ রিকগনিশন এবং ল্যাঙ্গুয়েজ ট্রান্সলেশনের মতো ডোমেইনে অসংখ্য state-of-the-art ফলাফল দিয়েছে, এবং বর্তমান AI অ্যাপ্লিকেশনের একটি বিস্তৃত অংশে ভূমিকা রাখে। কর্পোরেশনগুলি ডিপ লার্নিং ট্যালেন্টের জন্য লড়াইয়ে বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করেছে, Andrew Ng-এর মতো বিশিষ্ট প্রবক্তারা পরামর্শ দিচ্ছেন যে 'যদি একজন সাধারণ ব্যক্তি এক সেকেন্ডেরও কম চিন্তা করে একটি মানসিক কাজ করতে পারে, আমরা সম্ভবত AI ব্যবহার করে এটি এখন বা অদূর ভবিষ্যতে স্বয়ংক্রিয় করতে পারি।'
যাইহোক, প্রমাণ বলে যে ডিপ লার্নিং একটি প্রাচীরের কাছে পৌঁছাতে পারে। Keras নিউরাল নেটওয়ার্ক লাইব্রেরির লেখক François Chollet ডিসেম্বর ২০১৭ সালে উল্লেখ করেছিলেন: 'বেশিরভাগ সমস্যার জন্য যেখানে ডিপ লার্নিং রূপান্তরমূলকভাবে ভাল সমাধান সক্ষম করেছে (ভিশন, স্পিচ), আমরা ২০১৬-২০১৭ সালে হ্রাসমান রিটার্নের অঞ্চলে প্রবেশ করেছি।' এমনকি ডিপ লার্নিং-এর দাদা Geoff Hinton-ও স্বীকার করেন যে 'ভবিষ্যৎ নির্ভর করে কিছু গ্র্যাজুয়েট ছাত্রের উপর যারা আমি যা কিছু বলেছি তার প্রতি গভীরভাবে সন্দিহান।'
এই গবেষণাপত্রটি অযৌক্তিক উত্সাহকে সংযত করার লক্ষ্য রাখে, একই সাথে বিবেচনা করে যে ক্ষেত্রটিকে এগিয়ে নিতে কী প্রয়োজন, টেকনিক্যাল গবেষক এবং কম টেকনিক্যাল ব্যাকগ্রাউন্ডের AI ভোক্তা উভয়কেই সম্বোধন করে যারা বুঝতে চান ক্ষেত্রটি কোথায় যাচ্ছে।
ডিপ লার্নিং কী এবং এটি কী ভালো করে
ডিপ লার্নিং মেশিন লার্নিং টেকনিকের একটি শ্রেণীকে বোঝায় যা ফিচার এক্সট্রাকশন এবং ট্রান্সফর্মেশনের জন্য একাধিক স্তরের ননলিনিয়ার প্রসেসিং ইউনিট ব্যবহার করে। প্রতিটি পরবর্তী স্তর পূর্ববর্তী স্তরের আউটপুটকে ইনপুট হিসেবে ব্যবহার করে, সিস্টেমটিকে একাধিক স্তরের বিমূর্ততা সহ ডেটার উপস্থাপনা শিখতে দেয়।
ডিপ লার্নিং-এর মৌলিক শক্তি lies তার backpropagation অ্যালগরিদমের মাধ্যমে বড় ডেটা সেটে জটিল কাঠামো আবিষ্কার করার ক্ষমতায়, যা gradient descent ব্যবহার করে নিউরনগুলির মধ্যে সংযোগের ওজন সামঞ্জস্য করে। এই পদ্ধতিটি সেই সমস্যাগুলির জন্য অত্যন্ত শক্তিশালী প্রমাণিত হয়েছে যেখানে:
- ইনপুট-আউটপুট ম্যাপিং জটিল কিন্তু প্রচুর ডেটা থেকে শেখা যেতে পারে
- কাজের জন্য প্রয়োজনীয় ফিচারগুলি human engineers দ্বারা সহজে নির্দিষ্ট করা যায় না
- সমস্যাটি perceptual টাস্ক জড়িত যা মানুষ এবং প্রাণীরা স্বাভাবিকভাবে সমাধান করে
ডিপ লার্নিং বেশ কয়েকটি মূল ডোমেইনে উল্লেখযোগ্য সাফল্য অর্জন করেছে:
কম্পিউটার ভিশন
Convolutional Neural Networks (CNNs) কম্পিউটার ভিশনে বিপ্লব ঘটিয়েছে, ইমেজ ক্লাসিফিকেশন, অবজেক্ট ডিটেকশন এবং ফেসিয়াল রিকগনিশনের মতো কাজে human-level পারফরম্যান্স অর্জন করেছে। ২০১২ সালের ImageNet ব্রেকথ্রু demonstrated যে deep networks পূর্ববর্তী পদ্ধতিগুলিকে উল্লেখযোগ্যভাবে outperform করতে পারে, top-5 error rates 26% থেকে 15% কমিয়ে দেয়।
স্পিচ রিকগনিশন
Recurrent Neural Networks (RNNs) এবং Long Short-Term Memory (LSTM) নেটওয়ার্কগুলি স্পিচ রিকগনিশন সিস্টেমগুলিকে নাটকীয়ভাবে উন্নত করেছে, controlled environments-এ error rates near-human levels-এ নেমে এসেছে। Google, Apple এবং Amazon-এর মতো কোম্পানিগুলি তাদের ভার্চুয়াল অ্যাসিস্ট্যান্টে এই প্রযুক্তিগুলি ইন্টিগ্রেট করেছে।
প্রাকৃতিক ভাষা প্রক্রিয়াকরণ
Sequence-to-sequence মডেল এবং attention mechanisms মেশিন ট্রান্সলেশন, টেক্সট সামারাইজেশন এবং প্রশ্নোত্তর সিস্টেমে উল্লেখযোগ্য অগ্রগতি সক্ষম করেছে। Google-এর Neural Machine Translation সিস্টেম এই অগ্রগতির একটি বিশিষ্ট উদাহরণ উপস্থাপন করে।
গেম খেলা
ডিপ রিইনফোর্সমেন্ট লার্নিং এমন সিস্টেম তৈরি করেছে যা Go, Chess এবং ভিডিও গেমের মতো জটিল গেমে human experts-কে অতিক্রম করে। DeepMind-এর AlphaGo এবং OpenAI-এর Dota 2 bots ডিপ লার্নিংকে রিইনফোর্সমেন্ট লার্নিংয়ের সাথে combine করার সম্ভাবনা demonstrate করে।
এই সাফল্যগুলির মধ্যে সাধারণ থ্রেড হল ডিপ লার্নিং-এর raw ডেটা থেকে স্বয়ংক্রিয়ভাবে প্রাসঙ্গিক ফিচার শেখার ক্ষমতা, eliminating the need for