پیشرفت سریع در هوش مصنوعی مولد، در طی دو سه سال گذشته، پتانسیلی واقعی برای افزایش چشمگیر دسترسیپذیری در بسیاری از جنبههای زندگی برای افراد نابینا و کمبینا را دارد. احتمالاً قبلاً در مورد مزایای استفاده از خدماتی مثل بی مای آیز و ویژگیهای تشخیص در سیستمعامل آیاواس شنیدهاید. بااینحال، با افزایش پیچیدگی و درک هوش مصنوعی، این خدمت برای بهبود دسترسیپذیری در رایانه هم ارزشمند شده است.
در این شماره از ماهنامه نسل مانا، در ستون فناوری, ما به بررسی بعضی کاربردهای هوش مصنوعی در زندگی یک فرد نابینا یا کمبینا میپردازیم. در این مقاله, روی مدل هوش مصنوعی جیپیتی-۴او تمرکز خواهیم کرد. اگرچه با استفاده از سایر مدلهای بسیار پیچیده هوش مصنوعی مانند جِمینای از شرکت گوگل، کِلُود از شرکت اَنتراپیک و لاما از شرکت مِتا هم ممکن است به نتایج مشابهی برسیم.
بهبود دسترسیپذیری پروندههای پیدیاف
حتی در دسترسیپذیرترین حالت ممکن هم پیمایش و مدیریت اسناد پیدیاف با صفحهخوان، چالشبرانگیز است. هرچند خدماتی برای تبدیل پروندههای پیدیاف به قالبهای مناسبتری برای صفحهخوانها مثل وُرد یا ایچتیامال وجود دارد، این تبدیلگرها اغلب در پیروی دقیق از ساختار برچسبهای پرونده پیدیاف اصلی مشکل دارند. علاوه بر این، بسیاری از اسناد پیدیاف فاقد برچسبگذاری مناسباند و نیاز به استفاده از گزینه مربوط به استنباط ترتیب خواندن از سند در برنامه اَدُوبی ریدِر دارند که عملکرد مناسبی ندارد.
بررسیها نشان میدهد که هوش مصنوعی مولد، میتواند محتویات یک پرونده پیدیاف ساختاربندینشده را دریافت کند و با قالببندی مناسب, آن را به یک قالب دسترسیپذیر، با قالببندی مناسب تبدیل کند. اگر یک پرونده پیدیاف تصویری داشته باشیم، میتوانیم آن را به طور مستقیم به هوش مصنوعی بدهیم یا با استفاده از یک سرویس، آن را به تصاویر جداگانه تقسیم کنیم و سپس تصاویر را برای دقت بیشتر در کار، یکییکی به هوش مصنوعی بدهیم. صرفاً درخواستکردن از هوش مصنوعی برای تبدیل پرونده پیدیاف به قالب مورد نظرمان با پارامترهایی خاص و سپس بارگذاری پرونده پیدیاف به طور مستقیم, میتواند نتایج خوبی به دنبال داشته باشد.
بااینحال، این مهم است که از تمایل هوش مصنوعی به داشتن توهّم، یعنی ارائه دادههای نادرست بهعنوان دادههای واقعی آگاه باشید؛ بهعنوانمثال، در بررسیها هنگامی که یک پرونده پیدیاف در هوش مصنوعی بارگذاری شد، بعد از نقطهای خاص هوش مصنوعی شروع کرد به حدسزدن مطالب و تولید متنی که به طور دقیق محتوای پرونده پیدیاف را منعکس نمیکرد. روش بهتر این است که تمام متن را از داخل پرونده پیدیاف انتخاب کرده و آن را در هوش مصنوعی پیست کنیم که نتیجه آن بسیار دقیقتر خواهد بود.
انعطافپذیری و قابلیت سازگاری مدلهای هوش مصنوعی مدرن
توانایی مدلهای مدرن هوش مصنوعی در پیروی از دستورالعملها، بهصورت ادامهدار و بدون نیاز به درخواستهای بیش از حد دقیق، بسیار مفید است. در حین بررسی امکانات هوش مصنوعی، بعضیاوقات هوش مصنوعی در حال تولید قالبهای مورد نظر نبود یا به طور نادرست دادهها را ساختاربندی میکرد. در این موارد، ازآنجاییکه هوش مصنوعی فقط میتواند بخشی از اطلاعات خواستهشده را در هر زمان تولید کند، این امکان وجود داشت که در نقاط خاصی فرایند را قطع کرد و از هوش مصنوعی خواست که کار را مجدداً از اول انجام دهد. توانایی هوش مصنوعی در درک زبان ساده و کار با کاربر به شکلی که انگار یک انسان است، انعطافپذیری زیادی را در نحوه ارائه اطلاعات و آنچه میتوانیم از هوش مصنوعی بخواهیم، ارائه میدهد.
این عملکرد، محدود به پروندههای پیدیاف نیست؛ اگر دادههای متنی که قالببندی نشدهاند یا خواندن آنها دشوار است، مانند جداولی که بهدرستی طراحی نشدهاند، میتوانیم از هوش مصنوعی بخواهیم که آنها را قالببندی کند تا بسیار سادهتر بتوانیم آنها را بخوانیم.
دسترسی به دادههای موجود در تصاویر و تجزیهوتحلیل آنها
یکی دیگر از تواناییهای مفید هوش مصنوعی، استخراج و تجزیهوتحلیل دادهها از تصاویر است. اگر یک تصویر دسترسیپذیر نباشد یا حتی اگر دارای توصیف مناسب باشد؛ اما این توصیف فاقد جزئیات باشد، هوش مصنوعی میتواند در درک آن به ما کمک کند؛ برای مثال، ما میتوانیم یک تصویر بدون توصیف از یک جدول یا نمودار را به هوش مصنوعی بدهیم و پاسخ سؤالات خود در مورد دادههای موجود در آن را دریافت کنیم. هوش مصنوعی میتواند دادهها را به یک جدول متنی تبدیل کند یا آن را در قالب دیگری که کار با آن آسانتر باشد، ارائه دهد.
همچنین میتوانیم از هوش مصنوعی بخواهیم که دادهها را تجزیهوتحلیل کند. مثلاً اگر نموداری داریم که ردیابی دو آمار مختلف را نشان میدهد و میخواهیم بدانیم چه زمانی این دو آمار همگرا میشوند، میتوانیم این سؤال را از هوش مصنوعی بپرسیم. یک مثال کوچک میتواند نموداری باشد که ماهها را به همراه درآمد رستوران و تعطیلات در خود دارد. میتوانیم از هوش مصنوعی بپرسیم که آیا درآمد این رستوران در طول تعطیلات بالا یا پایین رفته است و در این صورت کدام تعطیلات باعث افزایش یا کاهش درآمد شدهاند. این نوع تجزیهوتحلیل که انجام بصری آن میتواند ساده باشد، اگر با دادههای خام کار کنیم، میتواند دشوار باشد. اما هوش مصنوعی قادر است آن را برای ما دسترسیپذیر کند.
سخن آخر
گذشته از این موارد، هوش مصنوعی احتمالاً میتواند در بسیاری از موقعیتهای دیگر نیز بسته به نیاز ما سودمند باشد. در کل، اگر شرایط به شکلی باشد که بتوانیم به کسی اطلاعات تصویری بدهیم و از او بخواهیم متن یا مفهوم مشابهی از آن را برایمان تهیه کند، میتوانیم این کار را با هوش مصنوعی انجام دهیم. ممکن است وقتی از هوش مصنوعی استفاده میکنیم، هنگام برخورد با موضوعات تخصصی، محدودیتهایی وجود داشته باشد؛ اما در بررسیهای انجامشده، تاکنون محدودیتهای اندکی مشاهده شده است.
با ادامه پیشرفت هوش مصنوعی، اینکه این فناوری ما را در مرحله بعدی به کجا خواهد برد، بسیار هیجانانگیز است. قالبهای ورودی جدید مثل صدا، مرتب به هوش مصنوعی اضافه میشوند و پیچیدگی و توانایی خودِ هوش مصنوعی به طور مداوم در حال افزایش است. ما در زمانی هیجانانگیز، برای دسترسیپذیری به کمک هوش مصنوعی زندگی میکنیم.