هوش مصنوعی چیست؟
اصطلاح «هوش مصنوعی» (Artificial Intelligence) یا AI برای توصیف سیستمی بهکار میرود که میتواند فعالیتهای شناختی وابسته به ذهن انسان ازجمله «یادگیری» و «حل مسئله» را بهخوبی یا حتی بهتر از انسانها انجام دهد. اما در اکثر موارد، آنچه بهعنوان هوش مصنوعی میشناسیم، درواقع «اتوماسیون» (Automation) یا همان فرایند خودکارسازی نام دارد و برای درک بهتر AI، ابتدا باید فرق آن را با اتوماسیون بدانیم.
بهطور کلی، دو نوع هوش مصنوعی وجود دارد: هوش مصنوعی قوی (strong AI) و هوش مصنوعی ضعیف (weak AI).
هوش مصنوعی قوی (strong AI)
هوش مصنوعی قوی همانی است که اکثر افراد با شنیدن AI متصور میشوند؛ یعنی نوعی هوش دانا . درمقابل، هوش مصنوعی ضعیف الگوریتمهای بسیار تخصصیای هستند که برای پاسخ به سوالات مشخص، مفید و محدود به حیطهی همان مسئله طراحی شدهاند؛ مثل موتور جستجوی گوگل و بینگ، الگوریتم پیشنهاد فیلم نتفلیکس یا حتی دستیار صوتی Siri و گوگلاسیستنت. این مدل AIها در سطح خود بسیار قابلتوجه هستند، هرچند کارایی آنها محدود است.
درحالحاضر، تمام AIهایی که میشناسیم از نوع ضعیف هستند و برخی از پژوهشگران معتقدند روشهایی که تابهحال برای توسعهی هوش مصنوعی ضعیف به کار رفتهاند، کاربردی در توسعهی هوش مصنوعی قوی نخواهند داشت. البته اگر نظر کارمندان شرکت OpenAI، توسعهدهندهی چتبات محبوب ChatGPT را بپرسید، به شما خواهند گفت تا ۱۳ سال آینده و با همین روشهای شناختهشده میتوانند به هوش مصنوعی قوی دست پیدا کنند!
نمونههای هوش مصنوعی
این روزها هوش مصنوعی را میتوان تقریبادر (خانه ی هوشمند)و هر چیزی دید؛ از دستیارهای صوتی مثل Siri اپل و الکسا آمازون گرفته تا الگوریتمهای پیشنهاد فیلم و آهنگ در نتفلیکس و اسپاتیفای و خودروهای خودران و انواع ربات هوشمند مثل ایمو، ایلیک و لونا
ChatGPT
ChatGPT نوعی چتبات آزمایشی یا بهتر است بگویم بهترین چتباتی است که تاکنون در دسترس عموم قرار گرفته است. این چتبات که نوامبر ۲۰۲۲ توسط شرکت OpenAI عرضه شد، مبتنیبر نسخهی ۳.۵ مدل زبانی GPT است.
در وصف شگفتیهایChatGPT حرفهای زیادی زده شده است. کاربران با تایپ درخواستهای خود در رابط کاربری بهشدت سادهی این چتبات، نتایج حیرتانگیزی دریافت میکنند؛ از تولید شعر و آهنگ و فیلمنامه گرفته تا نوشتن مقاله و کد و پاسخ به هر سؤالی که فکرش را بکنید؛ و تمام اینها تنها در کمتر از ده ثانیه انجام میشود. حجم دادههایی که ChatGPT با آنها آموزش داده شده به حدی وسیع است که خواندن تمام آنها به «هزار سال عمر انسانی» نیاز دارد. دادههایی که در دل این سیستم پنهان شده، دانش بینهایت بزرگی را دربارهی جهانی که در آن زندگی میکنیم، در خود جای داده است و بههمین خاطر میتواند تقریبا به تمام سوالهای ما پاسخ دهد.
DALL-E
پلتفرم مولد تصویر DALL-E که نامش از ترکیب سالوادور دالی، نقاش سورئالیست و انیمیشن WALL-E پیکسار گرفته شده است، یکی از جذابترین محصولات دیجیتال توسعهیافته در OpenAI است که در آن، درخواستهای متنی کاربر در عرض چند ثانیه به آثار هنری شگفتانگیزی تبدیل میشود.
نسخهی اول DALL-E براساس مدل GPT-3 توسعه یافت و تنها به ایجاد تصاویری در ابعاد ۲۵۶ در ۲۵۶ پیکسل محدود بود. اما نسخهی دوم که در آوریل ۲۰۲۲ وارد فاز بتای خصوصی شد، جهش بزرگی در حوزهی مولدهای تصویر مبتنی بر هوش مصنوعی محسوب میشود. تصاویری که DALL-E 2 قادر به ایجاد آنها است، حالا ۱۰۲۴ در ۱۰۲۴ پیکسل هستند و از تکنیکهای جدیدی چون «inpainting» استفاده میکنند که در آن بخشهایی از تصویر به انتخاب کاربر با تصویر دیگری جایگزین میشوند. جادوی DALL-E و دیگر مولدهای نظیر آن نه صرفاً به شناخت اشیا بهصورت جداگانه بلکه در درک فوقالعادهی آنها از روابط بین اشیا است؛ بهطوری که وقتی از آن میخواهید «فضانوردی سوار بر اسب» را ایجاد کند، خوب میداند منظور شما از این خواسته دقیقاً چیست. درحالحاضر، افرادی که به ChatGPT دسترسی دارند، میتوانند از پلتفرم Dall-E نیز استفاده کنند.
Copilot
مایکروسافت در سال ۲۰۱۸ علاوهبر کسب حق امتیاز GPT-3، ازطریق پلتفرم گیتهاب با OpenAI وارد همکاری شد تا ابزار هوش مصنوعی Copilot را توسعه دهند. Copilot درون برنامه ویرایشگر کد اجرا میشود و به توسعهدهندگان در نوشتن کد کمک میکند. استفاده از Copilot برای دانشجویان تأییدشده و گردانندگان پروژههای متنباز رایگان است و بهگفتهی گیتهاب، در فایلهایی که Copilot در آنها فعال است، نزدیک ۴۰ درصد کدها با این ابزار نوشته میشود. Copilot از مدل Codex شرکت OpenAI توسعه یافته که از نسل الگوریتم پرچمدار GPT-3 است.
Jukebox
سیستم Jukebox واقعاً حیرتانگیز است. کافی است به این بات ژانر آهنگ و نام هنرمند و متن آهنگ را بدهید تا نمونهای از یک آهنگ جدید را از صفر تا صد برایتان تولید کند. در پروفایل ساندکلاد OpenAI، به نمونههایی از آهنگهای تولیدشده با هوش مصنوعی Jukebox میتوانید گوش کنید. بهگفته این شرکت، متن آهنگها بهوسیلهی مدل زبانی و تعدادی از پژوهشگران نوشته شده است. به جز Jukebox، ابزار هوش مصنوعی جدید گوگل بهنام MusicLM هم قادر به تولید آهنگ براساس توضیح متنی است؛ هرچند این ابزار هنوز در دسترس عموم قرار نگرفته است. بهگفتهی گوگل، MusicLM در مجموع با دادههای متشکلاز ۲۸۰ هزار ساعت موسیقی آموزش داده شده تا یاد بگیرد براساس توضیحات دریافتی، آهنگهایی منسجم و پیچیده تولید کند. بهعنوان مثال این ابزار میتواند با ارائهی دستور «آهنگ جاز با یک تکنوازی ساکسیفون و یک تکخوان» یا «آهنگ تکنو دههی ۹۰ با بیس کم و ضربات قدرتمند»، آهنگهای بسیار باکیفیتی بسازد. خروجی این هوش مصنوعی بسیار چشمگیر است و به موسیقیهایی که هنرمندان انسانی ساختهاند، شباهت دارد.
Midjourney
میدجرنی هم مانند Dall-E نوعی بات تعاملی است که از یادگیری ماشین برای ایجاد تصاویر مبتنی بر متن استفاده میکند. این پلتفرم بر بستر دیسکورد قابل استفاده است و نسخهی رایگان آن به کاربران اجازهی چند درخواست محدود را میدهد. تمام درخواستهای کاربران دیگر و تصاویر تولید شده توسط میدجرنی در کانال دیسکورد این پلتفرم قابلمشاهده است.
یکی از جذابیتهای میدجرنی ساخت انواع مختلفی از یک تصویر یکسان است. به این ترتیب میتوان با کنار هم قرار دادن تصاویر یک انیمیشن جذاب به سبک «استاپ موشن» ساخت. از نظر برخی، تصاویر تولید شده با میدجرنی کیفیت و خلاقیت بیشتری از DALL-E دارند.
New Bing
«بینگ جدید» درواقع همان موتور جستوجوی نامآشنا و البته بداقبال مایکروسافت است که حالا به مدل هوش مصنوعی بسیار قدرتمندی مجهز شده تا هم تلاش دوبارهای باشد برای پایان دادن به یکهتازی چندین سالهی موتور جستوجوی گوگل و هم روش جستوجوی ما در اینترنت را بهطور کامل زیرورو و آنطور که مایکروسافت امیدوار است، بهتر از قبل کند.
اگر از قابلیتهای ChatGPT شگفتزده شدهاید، احتمالا از نسخهی بهکار رفته در بینگ بیشتر متحیر شوید؛ چراکه مایکروسافت میگوید مدل زبانی مورداستفاده در بینگ، GPT-4 است که به ۷۰۰ میلیارد پارامتر مجهز شده است. درضمن، چتبات بینگ به اینترنت متصل و اطلاعاتش همیشه بهروز است. در بینگ جدید میتوانید سوال خود را با زبان طبیعی بپرسید تا هوش مصنوعی با همان زبان طبیعی شروع به پاسخگویی کند. مایکروسافت میگوید این مدل پاسخدهی به درخواستهای کاربران از سرچ سنتی، کاربردیتر و مفیدتر است.
LaMDA
LaMDA نیز مانند ChatGPT، چتبات مبتنیبر یادگیری ماشین است که برای صحبتکردن دربارهی هر نوع موضوعی طراحی شده است. این چتبات که مخفف Language Model for Dialogue Applications بهمعنای «مدل زبانی برای کاربردهای مکالمهای» است، برپایهی معماری شبکهی عصبی ترنسفورمر ایجاد شده که گوگل آن را در سال ۲۰۱۷ طراحی کرده بود؛ شبکهای که دقیقا در ساخت ChatGPT نیز به کار رفته است. گوگل کماکان از عرضهی عمومی لمدا سرباز میزند؛ اما سال گذشته این چتبات پس از آنکه یکی از کارمندان گوگل مدعی شد به خودآگاهی رسیده، حسابی خبرساز شد. این فرد در ادعایی جنجالی که منجر به اخراجش از گوگل شد، گفت LaMDA احساسات و تجربیات ذهنی دارد؛ بههمیندلیل، خودآگاه است. ادعای خودآگاه بودن LaMDA هم از طرف گوگل و هم از سمت متخصصان حوزهی هوش مصنوعی قویا رد شده است. راستش تکنولوژی هوش مصنوعی هنوز تا رسیدن به سیستمهای خودآگاه فاصلهی زیادی دارد؛ فاصلهای که به اعتقاد بسیاری از کارشناسان، به ۵۰ سال میرسد.
PaLM
PaLM مخفف Pathways Language Model مدل زبانی دیگری از گوگل است که بهمراتب از لمدا پیچیدهتر است. گوگل PaLM را در رویداد I/O 2022 همزمان با معرفی LaMDA 2 رونمایی کرد که بهتازگی در دسترس توسعهدهندگان قرار گرفته است. این مدل میتواند ازپسِ کارهایی برآید که LaMDA نمیتواند انجامشان دهد؛ کارهایی مثل حل مسائل ریاضی، کدنویسی، ترجمهی زبان برنامهنویسی C به پایتون، خلاصهنویسی متن و توضیحدادن لطیفه. موردی که حتی خود توسعهدهندگان را نیز غافلگیر کرد، این بود که PaLM میتواند استدلال کند یا دقیقتر بگوییم PaLM میتواند فرایند استدلال را اجرا کند.
PaLM به ۵۴۰ میلیارد پارامتر مجهز است که از LaMDA چهار برابر و از مدل زبانی GPT-3 بهکار رفته در ChatGPT، سه برابر بیشتر است. PaLM بهدلیل بهرهمندی از چنین مجموعهی گستردهای از پارامتر، میتواند صدها کار مختلف را بدون نیاز به آموزش انجام دهد و شاید عدهای حتی وسوسه شوند که این مدل را نزدیکترین دستاورد بشر به «هوش مصنوعی قوی» بدانند، چون میتواند هر کار مبتنیبر تفکری را که انسان میتواند انجامش دهد، بدون آموزش خاصی انجام دهد.
- Seller
- فروردین 19, 1403
- 778 بازدید