فناوری ، راهنمای ویوپوینت، ابزاری برای تشخیص تصویر با هوش مصنوعی برای کاربران نابینا و کمبینای ویندوز
میثم امینی
اگر اینترنت روبهمرگ ایران به شما اجازه داده باشد، احتمالاً تا کنون از ابزارهای هوش مصنوعی مختلفی برای آسانتر کردن زندگی خود بهره گرفتهاید.
در این شماره از نسل مانا در ستون فناوری میخواهیم با یکی از این ابزارهای مفید که ویوپوینت Viewpoint نام دارد و مناسب کاربران ویندوز است آشنا شویم.
پس در مطالعه این مطلب ما را همراهی کنید.
تشخیص تصویر مبتنی بر هوش مصنوعی چه در دنیای واقعی و چه در فناوری دیجیتال بهبود چشمگیری را در دسترسیپذیری برای افراد نابینا و کمبینا ایجاد کرده است. این فناوری نه تنها در دنیای واقعی هنگام شناسایی اشیا یا مکانها مفید است؛ بلکه، در شناسایی مواردی در رایانه و تلفن هوشمند که دسترسیپذیر نیستند نیز به همان اندازه کارآمد است.
به عنوان مثال سیل رسانههای اجتماعی مبتنی بر تصویر، این فناوری را فوقالعاده مفید کرده است؛ زیرا اکنون میتوانیم به طور مستقل میمهای تصویری و سایر تصاویر را مشاهده کنیم.
قبلاً برای دسترسی به تشخیص تصویر مبتنی بر هوش مصنوعی باید از صفحه عکس میگرفتید و آن را با استفاده از رابط کاربری هوش مصنوعی مورد نظر خود آپلود میکردید؛ اما حالا در رایانههای شخصی ویندوز برنامهای به نام ویوپوینت به شما این امکان را میدهد که فوراً با فشاردادن یک کلید از فناوری تصویر هوش مصنوعی استفاده کنید.
ویوپوینت علاوه بر اینکه میتواند تصاویری را که ارسال میکنید تشخیص دهد، یک ویژگی انقلابی دارد که در آن میتوانید از تشخیص تصویر هوش مصنوعی برای تلاش در جهت استفاده از رابط کاربری برنامههای کاملاً غیر دسترسیپذیر استفاده کنید.
در این حالت ویوپوینت تصویر رابط کاربری برنامه را به هوش مصنوعی ارسال میکند که هوش مصنوعی در پاسخ، مختصات عناصر خاصی در تصویر را به برنامه ویوپوینت برمیگرداند. ویوپوینت سپس لیستی از عناصر تشخیصدادهشده از رابط کاربری برنامه غیر دسترسیپذیر را ایجاد میکند و به شما امکان میدهد تا آنها را با تب مرور کرده و با استفاده از صفحه کلید فعال کنید. این کار کلیک با ماوس را روی ناحیهای از صفحه که هوش مصنوعی به عنوان محل آن عنصر رابط کاربری شناسایی کرده است شبیهسازی میکند.
ویوپوینت با ارسال اطلاعات به هوش مصنوعی جِمینای گوگل کار میکند؛ بنابراین، برای استفاده از این برنامه باید یک کلید اِیپیآی از گوگل اِیآی استدیو دریافت کنید.
برای دریافت این کلید باید به این صفحه مراجعه کنید. در صفحه مربوط به کلید ایپیآی باید دکمه «کرِیت ایپیآی کی» را انتخاب کنید؛ کلیدِ خود را نامگذاری کرده و یک پروژه را برای مرتبط کردن آن انتخاب کنید.
اگر از قبل توسعهدهنده جِمینای نباشید، هیچ پروژهای نخواهید داشت؛ بنابراین، قبل از تولید کلید باید یک پروژه ایجاد کنید. گزینه «پِراجِکتس» را در منوی پیمایش پیدا کنید و از آنجا گزینه «کریت پِراجِکت» را انتخاب کنید. بعد صرفاً پروژه خود را نامگذاری و گزینه «کرِیت» را فعال کنید. پس از چند ثانیه به شما اطلاع داده میشود که پروژه ایجاد شده است.
حالا دکمه «گِت ایپیآی کی» را فشار داده و «کریت اِ کی» را انتخاب کنید. کلیدِ خود را نامگذاری کنید؛ پروژه تازه ایجاد شده خود را از منوی کشویی انتخاب کنید و گزینه «کریت» را فعال کنید.
پس از ایجاد کلید آن را در جدول پیدا کنید و برای کپی کردن آن در ستون آخر گزینه «کاپی ایپیآی کی» را فشار دهید.
وقتی برای اولین بار ویوپوینت را اجرا میکنید، یک کادر محاورهای ظاهر میشود که از شما میخواهد کلید خود را وارد کنید که میتوانید به سادگی آن را در آنجا پیست کنید. پس از وارد کردن کلید و فشردن دکمه «اوکی» ویوپوینت آماده استفاده خواهد بود.
پس از اجرا، ویوپوینت در پسزمینه منتظر میماند تا شما برای جِمینای درخواست ارسال کنید. هر بار زدن کلیدهای کنترل + شیفت + بکاسلش شما را بین حالتهای مختلف ویوپوینت جابهجا میکند؛ درحالیکه فشاردادن کلیدهای کنترل + شیفت + اسلش حالت انتخابشده را فعال میکند. این حالتها موارد زیر را شامل میشود: حالت اسکن عناصر رابط کاربری یک برنامه، انجام تشخیص کاراکتر نوری یا همان اوسیآر در کل صفحه نمایش، بازکردن یک کادر پرسوجو که در آن میتوانید به همراه اسکرینشات خود یک سؤال برای جِمینای ارسال کنید و بازکردن یک پیدیاف خوان که در آن میتوانید یک فایل پیدیاف که دسترسیپذیر نیست را برای ارسال به جِمینای انتخاب کنید تا متن را استخراج کند.
این میانبرهای صفحه کلید در منوی تنظیمات ویوپوینت قابل تنظیم هستند. میتوانید بخش تنظیمات ویوپوینت را با فشاردادن کلید میانبر پیشفرض کنترل + شیفت + آلت + وی یا با رفتن به سیستمتری اجرا کنید. ممکن است لازم باشد ناحیه سرریز را در سیستمتری گسترش دهید تا آیکون ویوپوینت را پیدا کنید. جایی که میتوانید تنظیمات را وارد کنید یا از ویوپوینت خارج شوید.
منوی تنظیمات همچنین به شما امکان میدهد نحوه مدیریت حالت رابط کاربری ویوپوینت را تغییر دهید. مثلاً تشخیص مجدد خودکار رابط کاربری برنامه بعد از انتخاب یک گزینه را فعال یا غیرفعال کنید و همچنین پخش صداهای ویوپوینت را روشن و خاموش کنید.
شما همچنین میتوانید انتخاب کنید که از کدام مدل جِمینای برای پرسوجوهای شما استفاده شود. ۲٫۰ فلش مدل پیشفرض است و مدلهای ۲٫۵ فلش و ۲٫۰ فلش لایت هم دردسترساند. ۲٫۰ فلش به دلیل تعادل سرعت و دقت پاسخ به طور پیشفرض انتخاب است.
استفاده از ویوپوینت ساده است. با فشردن کلید مربوط به حرکت بین حالتها به حالت مورد نظر خود بروید و سپس کلید فعالسازی را فشار دهید. صدای شاتر دوربین را خواهید شنید که به شما اطلاع میدهد حالت فعال شده است و همچنین صفحهخوان شما حالت فعالشده را به شما اطلاع میدهد.
درحالیکه تصویر شما دارد به جِمینای ارسال میشود و جِمینای پاسخ آن را برمیگرداند، صدای بارگیری یا «لطفاً منتظر بمانید» را خواهید شنید. پس از دریافت، پاسخ در یک کادر محاورهای بهصورت متن ساده نمایش داده میشود. در اینجا میتوانید پاسخ را بخوانید یا در صورت تمایل کپی کنید و کادر محاورهای را ببندید.
حالت رابط کاربری کمی متفاوت است. بعد از اینکه یک عکس فوری از رابط کاربری برنامه گرفته میشود میتوانید از کلیدهای تب و شیفت + تب برای گردش بین عناصر شناساییشده از رابط کاربری استفاده کنید و کلید اینتر را برای فعالکردن یک عنصر خاص فشار دهید. بسته به تنظیمات شما ویوپوینت ممکن است منتظر بماند و سپس با فرض اینکه رابط کاربری تغییر کرده است یک عکس جدید از رابط کاربری بگیرد و آن را شناسایی کند.
برای خروج از این حالت به یک حالت دیگر از ویوپوینت بروید که باعث میشود حالت پیمایش در رابط کاربری بسته شود.
به طور کلی ویوپوینت بهخوبی و با خطاهای کم کار میکند؛ اما برخی خطاهای مداوم وجود دارد که ممکن است لازم باشد آنها را برطرف کنید. یکی از این مشکلات این است که اگر ویوپوینت را برای مدت طولانی بدون استفاده رها کنید به برخی از کلیدهای فشردهشده پاسخ نمیدهد یا ارسال اطلاعات به جِمینای را متوقف میکند.
کلید کنترل + شیفت + اف۴ برای بستن ویوپوینت در نظر گرفته شده است که باید در این شرایط از آن استفاده کنید؛ اما ممکن است لازم باشد کار بستن برنامه را از سیستمتری انجام دهید؛ زیرا در این شرایط فشردن کلیدهای مربوط به بستن برنامه اغلب بیپاسخ میماند.
علاوه بر این، قبل از درخواست اطلاعات جدید از هوش مصنوعی حتماً پنجرههای محاورهای را ببندید؛ زیرا، یک پنجره محاورهای باز گاهی اوقات میتواند باعث بروز رفتار عجیبوغریب شود.
دانلود و استفاده از ویوپوینت رایگان است و با سطح رایگان ایپیآی جِمینای سهمیه استفاده نسبتاً سخاوتمندانهای دریافت میکنید. اگر توصیف تصویر هوش مصنوعی برای شما مفید است استفاده از این برنامه را توصیه میکنیم.
میتوانید برنامه ویوپوینت را از اینجا دریافت کنید.
منبع شماره زمستان ۲۰۲۵ مجله اَکسِسوُرد
ترجمه و گردآوری: میثم امینی