افزایش دسترسی‌پذیری دیجیتالی با استفاده از هوش مصنوعی

میثم امینی

0

پیشرفت سریع در هوش مصنوعی مولد، در طی دو سه سال گذشته، پتانسیلی واقعی برای افزایش چشمگیر دسترسی‌پذیری در بسیاری از جنبه‌های زندگی برای افراد نابینا و کم‌بینا را دارد. احتمالاً قبلاً در مورد مزایای استفاده از خدماتی مثل بی مای آیز و ویژگی‌های تشخیص در سیستم‌عامل آی‌او‌اس شنیده‌اید. بااین‌حال، با افزایش پیچیدگی و درک هوش مصنوعی، این خدمت برای بهبود دسترسی‌پذیری در رایانه هم ارزشمند شده است.

در این شماره از ماهنامه نسل مانا، در ستون فناوری, ما به بررسی بعضی کاربردهای هوش مصنوعی در زندگی یک فرد نابینا یا کم‌بینا می‌پردازیم. در این مقاله, روی مدل هوش مصنوعی جی‌پی‌تی-۴‌او تمرکز خواهیم کرد. اگرچه با استفاده از سایر مدل‌های بسیار پیچیده هوش مصنوعی مانند جِمینای از شرکت گوگل، کِلُود از شرکت اَنتراپیک و لاما از شرکت مِتا هم ممکن است به نتایج مشابهی برسیم.

بهبود دسترسی‌پذیری پرونده‌های پی‌دی‌اف

حتی در دسترسی‌پذیرترین حالت ممکن هم پیمایش و مدیریت اسناد پی‌دی‌اف با صفحه‌خوان، چالش‌برانگیز است. هرچند خدماتی برای تبدیل پرونده‌های پی‌دی‌اف به قالب‌های مناسب‌تری برای صفحه‌خوان‌ها مثل وُرد یا ایچ‌تی‌ام‌ال وجود دارد، این تبدیل‌گرها اغلب در پیروی دقیق از ساختار برچسب‌های پرونده پی‌دی‌اف اصلی مشکل دارند. علاوه بر این، بسیاری از اسناد پی‌دی‌اف فاقد برچسب‌گذاری مناسب‌اند و نیاز به استفاده از گزینه مربوط به استنباط ترتیب خواندن از سند در برنامه اَدُوبی ریدِر دارند که عملکرد مناسبی ندارد.

بررسی‌ها نشان می‌دهد که هوش مصنوعی مولد، می‌تواند محتویات یک پرونده پی‌دی‌اف ساختاربندی‌نشده را دریافت کند و با قالب‌بندی مناسب, آن را به یک قالب دسترسی‌پذیر، با قالب‌بندی مناسب تبدیل کند. اگر یک پرونده پی‌دی‌اف تصویری داشته باشیم، می‌توانیم آن را به طور مستقیم به هوش مصنوعی بدهیم یا با استفاده از یک سرویس، آن را به تصاویر جداگانه تقسیم کنیم و سپس تصاویر را برای دقت بیشتر در کار، یکی‌یکی به هوش مصنوعی بدهیم. صرفاً درخواست‌کردن از هوش مصنوعی برای تبدیل پرونده پی‌دی‌اف به قالب مورد نظرمان با پارامترهایی خاص و سپس بارگذاری پرونده پی‌دی‌اف به طور مستقیم, می‌تواند نتایج خوبی به دنبال داشته باشد.

بااین‌حال، این مهم است که از تمایل هوش مصنوعی به داشتن توهّم، یعنی ارائه داده‌های نادرست به‌عنوان داده‌های واقعی آگاه باشید؛ به‌عنوان‌مثال، در بررسی‌ها هنگامی که یک پرونده پی‌دی‌اف در هوش مصنوعی بارگذاری شد، بعد از نقطه‌ای خاص هوش مصنوعی شروع کرد به حدس‌زدن مطالب و تولید متنی که به طور دقیق محتوای پرونده پی‌دی‌اف را منعکس نمی‌کرد. روش بهتر این است که تمام متن را از داخل پرونده پی‌دی‌اف انتخاب کرده و آن را در هوش مصنوعی پیست کنیم که نتیجه آن بسیار دقیق‌تر خواهد بود.

انعطاف‌پذیری و قابلیت سازگاری مدل‌های هوش مصنوعی مدرن

توانایی مدل‌های مدرن هوش مصنوعی در پیروی از دستورالعمل‌ها، به‌صورت ادامه‌دار و بدون نیاز به درخواست‌های بیش از حد دقیق، بسیار مفید است. در حین بررسی امکانات هوش مصنوعی، بعضی‌اوقات هوش مصنوعی در حال تولید قالب‌های مورد نظر نبود یا به طور نادرست داده‌ها را ساختاربندی می‌کرد. در این موارد، ازآنجایی‌که هوش مصنوعی فقط می‌تواند بخشی از اطلاعات خواسته‌شده را در هر زمان تولید کند، این امکان وجود داشت که در نقاط خاصی فرایند را قطع کرد و از هوش مصنوعی خواست که کار را مجدداً از اول انجام دهد. توانایی هوش مصنوعی در درک زبان ساده و کار با کاربر به شکلی که انگار یک انسان است، انعطاف‌پذیری زیادی را در نحوه ارائه اطلاعات و آنچه می‌توانیم از هوش مصنوعی بخواهیم، ارائه می‌دهد.

این عملکرد، محدود به پرونده‌های پی‌دی‌اف نیست؛ اگر داده‌های متنی که قالب‌بندی نشده‌اند یا خواندن آنها دشوار است، مانند جداولی که به‌درستی طراحی نشده‌اند، می‌توانیم از هوش مصنوعی بخواهیم که آنها را قالب‌بندی کند تا بسیار ساده‌تر بتوانیم آنها را بخوانیم.

دسترسی به داده‌های موجود در تصاویر و تجزیه‌وتحلیل آنها

یکی دیگر از توانایی‌های مفید هوش مصنوعی، استخراج و تجزیه‌وتحلیل داده‌ها از تصاویر است. اگر یک تصویر دسترسی‌پذیر نباشد یا حتی اگر دارای توصیف مناسب باشد؛ اما این توصیف فاقد جزئیات باشد، هوش مصنوعی می‌تواند در درک آن به ما کمک کند؛ برای مثال، ما می‌توانیم یک تصویر بدون توصیف از یک جدول یا نمودار را به هوش مصنوعی بدهیم و پاسخ سؤالات خود در مورد داده‌های موجود در آن را دریافت کنیم. هوش مصنوعی می‌تواند داده‌ها را به یک جدول متنی تبدیل کند یا آن را در قالب دیگری که کار با آن آسان‌تر باشد، ارائه دهد.

همچنین می‌توانیم از هوش مصنوعی بخواهیم که داده‌ها را تجزیه‌وتحلیل کند. مثلاً اگر نموداری داریم که ردیابی دو آمار مختلف را نشان می‌دهد و می‌خواهیم بدانیم چه زمانی این دو آمار همگرا می‌شوند، می‌توانیم این سؤال را از هوش مصنوعی بپرسیم. یک مثال کوچک می‌تواند نموداری باشد که ماه‌ها را به همراه درآمد رستوران و تعطیلات در خود دارد. می‌توانیم از هوش مصنوعی بپرسیم که آیا درآمد این رستوران در طول تعطیلات بالا یا پایین رفته است و در این صورت کدام تعطیلات باعث افزایش یا کاهش درآمد شده‌اند. این نوع تجزیه‌وتحلیل که انجام بصری آن می‌تواند ساده باشد، اگر با داده‌های خام کار کنیم، می‌تواند دشوار باشد. اما هوش مصنوعی قادر است آن را برای ما دسترسی‌پذیر کند.

سخن آخر

گذشته از این موارد، هوش مصنوعی احتمالاً می‌تواند در بسیاری از موقعیت‌های دیگر نیز بسته به نیاز ما سودمند باشد. در کل، اگر شرایط به شکلی باشد که بتوانیم به کسی اطلاعات تصویری بدهیم و از او بخواهیم متن یا مفهوم مشابهی از آن را برایمان تهیه کند، می‌توانیم این کار را با هوش مصنوعی انجام دهیم. ممکن است وقتی از هوش مصنوعی استفاده می‌کنیم، هنگام برخورد با موضوعات تخصصی، محدودیت‌هایی وجود داشته باشد؛ اما در بررسی‌های انجام‌شده، تاکنون محدودیت‌های اندکی مشاهده شده است.

با ادامه پیشرفت هوش مصنوعی، اینکه این فناوری ما را در مرحله بعدی به کجا خواهد برد، بسیار هیجان‌انگیز است. قالب‌های ورودی جدید مثل صدا، مرتب به هوش مصنوعی اضافه می‌شوند و پیچیدگی و توانایی خودِ هوش مصنوعی به طور مداوم در حال افزایش است. ما در زمانی هیجان‌انگیز، برای دسترسی‌پذیری به کمک هوش مصنوعی زندگی می‌کنیم.

 

منبع: شماره پاییز ۲۰۲۴ از فصلنامه اَکسِس‌وُرلد

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.

حاصل عبارت را در کادر بنویسید. *-- بارگیری کد امنیتی --