انقلابی در جیب شما: جمنای و دنیای جدید تعامل با گوشیهای هوشمند
به روزرسانیهای جدید گوگل برای جمینای و جستجوی حلقهای (Circle to Search) نگاهی به چگونگی تغییر و چرخش سیستم عامل اندروید به سمت هوش مصنوعی ارائه میدهند
تقریبا ده سال پیش، گوگل در اندروید مارشملو قابلیت هیجان انگیزی به نام Now on Tap معرفی کرد. با نگه داشتن دکمه خانه، اطلاعات مفیدی بر اساس محتوای صفحه نمایش داده میشد. مثلا در حال چت با دوستانتان درباره فیلمی بودید، Now on Tap بدون نیاز به خارج شدن از برنامه پیام رسان، جزئیات فیلم را برایتان پیدا میکرد. یا اگر به رستورانی در یلپ نگاه میکردید، با یک ضربه، لیست پیشنهادی OpenTable برای رزرو میز نمایش داده میشد. در آن زمان این پیشرفتها جادویی به نظر میرسیدند. توانایی گوشی در فهمیدن محتوای صفحه و پیش بینی کارهایی که ممکن است بخواهید انجام دهید، حسابی آیندهنگرانه بود. Now on Tap یکی از ویژگیهای هیجان انگیز در اندروید بود که بعدها به دستیار گوگل تبدیل شد. دستیار گوگل هم عالی بود ولی کارکردش دقیقا مشابه Now on Tap نبود.
در کنفرانس توسعه دهندگان گوگل I/O که در مانتین ویو، کالیفرنیا برگزار شد، ویژگیهای جدیدی که گوگل برای سیستم عامل اندروید معرفی کرد، شباهتهایی به Now on Tap قدیمی دارند. این ویژگیها با استفاده از اطلاعات محیطی اطراف شما، کار با گوشی را آسانتر میکنند. اما نکته کلیدی اینجاست که اینبار، این قابلیتها با یک دهه پیشرفت در مدلهای زبانی بزرگ تقویت شدهاند. دیو برک، معاون مهندسی اندروید، چنین اظهار داشت: «نکته هیجانانگیز این است که ما اکنون فناوری ساخت دستیارهای واقعا قدرتمندی را در اختیار داریم. دستیارهایی که بتوانند آنچه را که میبینند درک کنند. چیزی که در آن زمان به خوبی نمیتوانستیم انجام دهیم. اما حالا این امکان را داریم.»
سامیر سمات، رئیس اکوسیستم اندروید در گوگل، درباره تازگیهای دنیای اندروید، دستیار هوش مصنوعی جدید جمنای و اینکه همه اینها برای آینده سیستم عامل اندروید چه معنایی دارد صحبت کرد و به این بهروزرسانیها به عنوان «فرصتی استثنایی برای اینکه دوباره تصور کنیم که یک گوشی چه کارهایی میتواند انجام دهد و کل سیستم عامل اندروید را بازنگری کنیم» اشاره کرد.
با قابلیت جدید گوگل به نام «جستجوی دایرهای» آشنا شوید این قابلیت، رویکرد جدید گوگل برای جستجو در گوشیهای موبایل است. جستجوی دایرهای که گوگل چند ماه پیش معرفی کرد، شبیه Now on Tap، تعاملیتر از تایپ کردن در کادر جستجو است. (شما به معنای واقعی کلمه، دور چیزی که میخواهید در موردش جستجو کنید، روی صفحه دایره میکشید.) برک میگوید: «این یک روش بسیار ملموس، سرگرمکننده و مدرن برای جستجو است ... به نظر میرسد کاربران جوانتر هم به خاطر سرگرمکننده بودنش بیشتر از آن استفاده میکنند.»
سمات ادعا میکند که گوگل بازخوردهای مثبتی از کاربران دریافت کرده است، اما آخرین ویژگی جستجوی دایرهای به طور خاص بر اساس بازخورد دانشجویان طراحی شده است. اکنون دانشجویان میتوانند با کشیدن دایره به دور مسائل ریاضی و فیزیک، از قابلیت جستجوی دایرهای استفاده کنند. گوگل بدون اینکه کاربر از اپلیکیشن خلاصهنویسی خارج شود، راه حل مرحله به مرحله برای حل مسائل را ارائه میدهد. سمات تاکید کرد که جمنای فقط پاسخ سوالات را ارائه نمیدهد بلکه به دانشآموزان نحوه حل مسائل را نیز نشان میدهد. تا اواخر امسال، جستجوی دایرهای قادر به حل مسائل پیچیدهتر مانند نمودارها و شکلها خواهد بود. این قابلیتها همگی با مدلهای LearnLM گوگل که برای آموزش بهینهسازی شدهاند، کار میکنند.
جمنای در اندروید زمینهمحورتر میشود
جمنای دستیار هوش مصنوعی گوگل است که در حال پیشرفت و ارتقای قابلیتهای خود است. به طوری که در حال حاضر در بسیاری از گوشیهای اندرویدی، به جای دستیار گوگل، میتوانید از جمنای استفاده کنید. اما آیا این موضوع به معنای از رده خارج شدن دستیار گوگل است؟ سمات در پاسخ به این سوال گفت: «جمنای یک تجربه اختیاری در گوشیهای اندرویدی است. به طور واضح، جمنای با گذشت زمان پیشرفتهتر میشود و قابلیتهای جدیدی به آن اضافه میشود. ما در حال حاضر خبر جدیدی برای اعلام نداریم، اما اگر کاربران بخواهند از این دستیار هوش مصنوعی جدید استفاده کنند، حق انتخاب دارند. آنها میتوانند جمنای را امتحان کنند و ما بازخوردهای مثبتی از کاربران دریافت کردهایم.»
در کنفرانس توسعهدهندگان گوگل (I/O) اینطور عنوان شد که بهروزرسانیهای جمنای در اندروید باعث میشوند که این دستیار هوش مصنوعی، درست مانند Now on Tap در حدود یک دهه پیش، زمینهمحورتر شود. تا پایان سال جاری، شما قادر خواهید بود با جمنای تصاویر ایجاد کنید و آنها را به صورت درگ و دراپ (کشیدن و رها کردن) وارد برنامههایی مانند جیمیل یا پیامهای گوگل کنید. برک نمونهای از تولید تصویر یک توپ تنیس با خیارشور توسط جمنای را در حالی که او در حال پاسخ دادن به پیام متنی کسی در مورد بازی پیکلبال بود، نشان داد. برک جمنای را که به صورت یک پوشش روی برنامه پیامرسان ظاهر شد، فراخواند و از آن خواست تا تصویر را تولید کند، سپس یکی از تصاویر را کشید و در چت رها کرد. بعد از آن، او یک ویدیوی یوتیوب در مورد قوانین پیکلبال را باز کرد. با فراخوانی جمنای در حین تماشای ویدیو، یک اعلان برای «پرسیدن سوال از این ویدیو» مشاهده خواهید کرد. این قابلیت به شما امکان میدهد تا از جمنای برای یافتن اطلاعات خاص در ویدیو بدون نیاز به اسکراب کردن کل ویدیو استفاده کنید. (چه کسی وقت برای این کار دارد؟) برک در مورد یک قانون خاص پیکلبال سوال کرد و جمنای به سرعت پاسخی مبتنی بر ویدیو ارائه داد. این عملکرد «خلاصهسازی» به ویژگی بارز بسیاری از ابزارهای هوش مصنوعی از جمله خلاصهسازی فایلهای PDF، ویدیوها، یادداشتها و اخبار تبدیل شده است.
راستی، به زودی میتوانید یک فایل PDF را به جمنای ضمیمه کنید (که برای آن یک اعلان «پرسیدن سوال از این PDF» وجود خواهد داشت) و جمنای میتواند اطلاعات خاصی را ارائه دهد، در نتیجه شما را از نیاز به اسکرول کردن در چندین صفحه نجات میدهد. برک میگوید این ویژگیها طی چند ماه آینده در دسترس میلیونها دستگاه قرار خواهند گرفت، اگرچه ویژگی PDF تنها برای کاربران جمنای Advanced در دسترس خواهد بود؛ کاربرانی که برای دسترسی به قابلیتهای پیشرفته مدلهای هوش مصنوعی گوگل، اشتراک ماهانه 20 دلاری پرداخت میکنند. به طور کلی، جمنای بر اساس آنچه در صفحه نمایش اتفاق میافتد، پیشنهادات «پویاتر» بیشتری را نشان میدهد. این پیشنهادات درست بالای پوشش جمنای هنگام فعال کردن دستیار ظاهر خواهند شد.
ارتقاء برای جمنای نانو
جمنای نانو، مدل بزرگ زبان گوگل است که برخی از قابلیتهای خاص را به صورت مستقیم روی دستگاه در برخی گوشیهای هوشمند، مانند سری پیکسل ۸، سری گلکسی اس ۲۴ سامسونگ و حتی پیکسل ۸A جدید، ارائه میکند. اجرای این قابلیتها به صورت درون-دستگاهی به این معنی است که نیازی به ارسال اطلاعات به فضای ابری (cloud) نیست و در نتیجه باعث میشود این قابلیتها از نظر حفظ حریم خصوصی کاربر، ایمنتر باشند. حتی امکان استفاده از آنها به صورت آفلاین نیز وجود دارد. در حال حاضر، قابلیت نانو امکاناتی مانند «خلاصهساز» را در برنامه ضبط صدای گوگل (Recorder) فراهم میکند که رونوشتها را خلاصه میکند. همچنین، قابلیت «پاسخ هوشمند» را در برخی برنامههای پیامرسان خاص ارائه میدهد که پاسخهای خودکار متنی بیشتری را در پاسخ به پیامها پیشنهاد میدهد. نسخه جدیدتر این مدل - جمنای نانو چندوجهی (Multimodality) - امسال و با گوشیهای پیکسل عرضه خواهد شد. این نام کمی طولانی به نظر میرسد، اما به طور کلی به این معنی است که جمنای نانو قادر خواهد بود فراتر از پردازش متن عمل کند. برک میگوید: «این مدل یک مدل چندوجهی با ۳.۸ میلیارد پارامتر است. این اولین مدل چندوجهی داخلی است که به صورت دروندستگاهی کار میکند. این مدل بسیار قدرتمند است. بر اساس معیارهای دانشگاهی، عملکردی در حدود ۸۰ درصد از جمنای ۱.۰ را ارائه میدهد که برای یک مدل کوچک، بسیار عالی است.»
این مدل جدید، از این پس قابلیت خواننده صفحه نمایش «TalkBack» موجود گوگل در اندروید را که به کاربران نابینا و کمبینا در درک محتوای صفحه کمک میکند، تقویت خواهد کرد. گفته میشود جمنای نانو توضیحات غنیتر و دقیقتری از محتوای هر تصویر ارائه میدهد. گوگل میگوید به طور متوسط، کاربران TalkBalk روزانه «۹۰ تصویر بدون برچسب» را مشاهده میکنند، اما جمنای میتواند این شکاف را پر کند، زیرا قادر خواهد بود تصاویر روی صفحه را تجسم و درک کند و حتی زمانی که کاربر به صورت آفلاین است آنها را توصیف کند. گوگل در چند سال گذشته بسیاری از تواناییهای هوش مصنوعی خود را برای بهبود فناوری غربالگری تماسهای تلفنی خود به کار گرفته است تا تماسهای اسپم را محدود کند. به زودی، جمنای نانو چندوجهی به شما کمک میکند تا از کلاهبرداریهای تلفنی - به صورت لحظهای - جلوگیری کنید.
یک ویژگی جدید به نام «تشخیص کلاهبرداری» وجود دارد که جمنای را در تماسهای تلفنی شما به گوش دادن وا میدارد و اگر عبارات یا درخواستهای خاصی را از فردی که با او صحبت میکنید تشخیص دهد، یک هشدار مبنی بر اینکه احتمالاً درگیر یک تماس تلفنی کلاهبرداری هستید، صادر میکند. برک میگوید این مدل با استفاده از دادههای وبسایتهایی مانند BanksNeverAskThat.com آموزش دیده است تا یاد بگیرد که یک بانک چه چیزی را از شما نمیپرسد – و یا چیزهایی که کلاهبرداران به طور معمول درخواست میکنند. او میگوید همه این فرآیند گوش دادن و تشخیص روی دستگاه انجام میشود، بنابراین از نظر حفظ حریم خصوصی کاربر، ایمن است. ما در اواخر امسال اطلاعات بیشتری در مورد این «ویژگی اختیاری» خواهیم شنید. بر خلاف روال معمول، گوگل اعلام کرده است که در روزهای آینده چند ویژگی جدید اندروید را معرفی خواهد کرد و قصد ندارد تمام موارد جدید را در اعلامیههای امروز فشرده کند، بنابراین برای اطلاعات بیشتر با ما همراه باشید. با ظهور ابزارهای سختافزاری هوش مصنوعی که برای جایگزینی تلفنهای هوشمند شما رقابت میکنند - و رابطهای تولیدی بدون برنامه - از نظر سمات اندروید در پنج سال آینده چگونه تغییر خواهد کرد؟ او از دیدن نوآوری شرکتهای جدید و موجود که چیزهای جدیدی را امتحان میکنند هیجانزده است - و اینکه گوگل نیز «در حال امتحان بسیاری از چیزها به صورت داخلی» است. اما او همه چیز را به یک قیاس با صنعت خودرو خلاصه کرد.
اگر شما یک ماشین بخرید، انتظار دارید ویژگیهای استاندارد خاصی مانند فرمان داشته باشید. اما با هوش مصنوعی، یک جهش بزرگ این است که این ویژگیها را حذف کنید - بدون فرمان، بدون رابط. سمات میگوید: «برخی از افراد از این ایده هیجانزده میشوند، در حالی که برخی دیگر شاید چندان خوشحال نباشند.» او معتقد است با کمک هوش مصنوعی، برخی از کارهایی که با گوشیهایمان انجام میدهیم، به شکل قابل توجهی «کمکیتر» خواهند شد. به عبارت دیگر، میتوانیم انتظار داشته باشیم که برخی از ویژگیهای رایج رابط کاربری به این ترتیب جایگزین شوند. سمات ادامه میدهد: «با پیشرفت هوش مصنوعی، شاهد فرصتهایی برای تغییر بنیادی رابط کاربری در برخی از زمینهها خواهیم بود. این تغییر زمانی رخ میدهد که از مرحلهی «این قابلیت واقعا کمکی است» به مرحلهی «در واقع، باید روش کاملا جدیدی برای انجام این کار وجود داشته باشد» برسیم. همین موضوع است که کار روی این تکنولوژی را در حال حاضر هیجانانگیز و سرگرمکننده میکند. و عصر حاضر یک دورهی فوقالعاده برای کار بر روی این فناوری به شمار میرود.»
برچسبها: