فناوری ، راهنمای ویوپوینت، ابزاری برای تشخیص تصویر با هوش مصنوعی برای کاربران نابینا و کم‌بینای ویندوز

میثم امینی

0

اگر اینترنت روبه‌مرگ ایران به شما اجازه داده باشد، احتمالاً تا کنون از ابزارهای هوش مصنوعی مختلفی برای آسان‌تر کردن زندگی خود بهره گرفته‌اید.

در این شماره از نسل مانا در ستون فناوری می‌خواهیم با یکی از این ابزارهای مفید که ویوپوینت Viewpoint  نام دارد و مناسب کاربران ویندوز است آشنا شویم.

پس در مطالعه این مطلب ما را همراهی کنید.

تشخیص تصویر مبتنی بر هوش مصنوعی چه در دنیای واقعی و چه در فناوری دیجیتال بهبود چشمگیری را در دسترسی‌پذیری برای افراد نابینا و کم‌بینا ایجاد کرده است. این فناوری نه تنها در دنیای واقعی هنگام شناسایی اشیا یا مکان‌ها مفید است؛ بلکه، در شناسایی مواردی در رایانه و تلفن هوشمند که دسترسی‌پذیر نیستند نیز به همان اندازه کارآمد است.

به عنوان مثال سیل رسانه‌های اجتماعی مبتنی بر تصویر، این فناوری را فوق‌العاده مفید کرده است؛ زیرا اکنون می‌توانیم به طور مستقل میم‌های تصویری و سایر تصاویر را مشاهده کنیم.

قبلاً برای دسترسی به تشخیص تصویر مبتنی بر هوش مصنوعی باید از صفحه عکس می‌گرفتید و آن را با استفاده از رابط کاربری هوش مصنوعی مورد نظر خود آپلود می‌کردید؛ اما حالا در رایانه‌های شخصی ویندوز برنامه‌ای به نام ویوپوینت  به شما این امکان را می‌دهد که فوراً با فشاردادن یک کلید از فناوری تصویر هوش مصنوعی استفاده کنید.

ویوپوینت علاوه بر اینکه می‌تواند تصاویری را که ارسال می‌کنید تشخیص دهد، یک ویژگی انقلابی دارد که در آن می‌توانید از تشخیص تصویر هوش مصنوعی برای تلاش در جهت استفاده از رابط کاربری برنامه‌های کاملاً غیر دسترسی‌پذیر استفاده کنید.

در این حالت ویوپوینت تصویر رابط کاربری برنامه را به هوش مصنوعی ارسال می‌کند که هوش مصنوعی در پاسخ، مختصات عناصر خاصی در تصویر را به برنامه ویوپوینت برمی‌گرداند. ویوپوینت سپس لیستی از عناصر تشخیص‌داده‌شده از رابط کاربری برنامه غیر دسترسی‌پذیر را ایجاد می‌کند و به شما امکان می‌دهد تا آن‌ها را با تب مرور کرده و با استفاده از صفحه کلید فعال کنید. این کار کلیک با ماوس را روی ناحیه‌ای از صفحه که هوش مصنوعی به عنوان محل آن عنصر رابط کاربری شناسایی کرده است شبیه‌سازی می‌کند.

ویوپوینت با ارسال اطلاعات به هوش مصنوعی جِمینای گوگل کار می‌کند؛ بنابراین، برای استفاده از این برنامه باید یک کلید اِی‌پی‌آی از گوگل اِی‌آی استدیو دریافت کنید.

برای دریافت این کلید باید به این صفحه مراجعه کنید. در صفحه مربوط به کلید ای‌پی‌آی باید دکمه «کرِیت ای‌پی‌آی کی» را انتخاب کنید؛ کلیدِ خود را نام‌گذاری کرده و یک پروژه را برای مرتبط کردن آن انتخاب کنید.

اگر از قبل توسعه‌دهنده جِمینای نباشید، هیچ پروژه‌ای نخواهید داشت؛ بنابراین، قبل از تولید کلید باید یک پروژه ایجاد کنید. گزینه «پِراجِکتس» را در منوی پیمایش پیدا کنید و از آنجا گزینه «کریت پِراجِکت» را انتخاب کنید. بعد صرفاً پروژه خود را نام‌گذاری و گزینه «کرِیت» را فعال کنید. پس از چند ثانیه به شما اطلاع داده می‌شود که پروژه ایجاد شده است.

حالا دکمه «گِت ای‌پی‌آی کی» را فشار داده و «کریت اِ کی» را انتخاب کنید. کلیدِ خود را نام‌گذاری کنید؛ پروژه تازه ایجاد شده خود را از منوی کشویی انتخاب کنید و گزینه «کریت» را فعال کنید.

پس از ایجاد کلید آن را در جدول پیدا کنید و برای کپی کردن آن در ستون آخر گزینه «کاپی ای‌پی‌آی کی» را فشار دهید.

وقتی برای اولین بار ویوپوینت را اجرا می‌کنید، یک کادر محاوره‌ای ظاهر می‌شود که از شما می‌خواهد کلید خود را وارد کنید که می‌توانید به سادگی آن را در آنجا پیست کنید. پس از وارد کردن کلید و فشردن دکمه «او‌کی» ویوپوینت آماده استفاده خواهد بود.

پس از اجرا، ویوپوینت در پس‌زمینه منتظر می‌ماند تا شما برای جِمینای درخواست ارسال کنید. هر بار زدن کلیدهای کنترل + شیفت + بک‌اسلش شما را بین حالت‌های مختلف ویوپوینت جابه‌جا می‌کند؛ در‌حالی‌که فشاردادن کلیدهای کنترل + شیفت + اسلش حالت انتخاب‌شده را فعال می‌کند. این حالت‌ها موارد زیر را شامل می‌شود: حالت اسکن عناصر رابط کاربری یک برنامه، انجام تشخیص کاراکتر نوری یا همان او‌سی‌آر در کل صفحه نمایش، بازکردن یک کادر پرس‌وجو که در آن می‌توانید به همراه اسکرین‌شات خود یک سؤال برای جِمینای ارسال کنید و بازکردن یک پی‌دی‌اف خوان که در آن می‌توانید یک فایل پی‌دی‌اف که دسترسی‌پذیر نیست را برای ارسال به جِمینای انتخاب کنید تا متن را استخراج کند.

این میان‌برهای صفحه کلید در منوی تنظیمات ویوپوینت قابل تنظیم هستند. می‌توانید بخش تنظیمات ویوپوینت را با فشاردادن کلید میان‌بر پیش‌فرض کنترل + شیفت + آلت + وی یا با رفتن به سیستم‌تری اجرا کنید. ممکن است لازم باشد ناحیه سرریز را در سیستم‌تری گسترش دهید تا آیکون ویوپوینت را پیدا کنید. جایی که می‌توانید تنظیمات را وارد کنید یا از ویوپوینت خارج شوید.

منوی تنظیمات همچنین به شما امکان می‌دهد نحوه مدیریت حالت رابط کاربری ویوپوینت را تغییر دهید. مثلاً تشخیص مجدد خودکار رابط کاربری برنامه بعد از انتخاب یک گزینه را فعال یا غیرفعال کنید و همچنین پخش صداهای ویوپوینت را روشن و خاموش کنید.

شما همچنین می‌توانید انتخاب کنید که از کدام مدل جِمینای برای پرس‌وجوهای شما استفاده شود. ۲٫۰ فلش مدل پیش‌فرض است و مدل‌های ۲٫۵ فلش و ۲٫۰ فلش لایت هم دردسترس‌اند. ۲٫۰ فلش به دلیل تعادل سرعت و دقت پاسخ به طور پیش‌فرض انتخاب است.

استفاده از ویوپوینت ساده است. با فشردن کلید مربوط به حرکت بین حالت‌ها به حالت مورد نظر خود بروید و سپس کلید فعال‌سازی را فشار دهید. صدای شاتر دوربین را خواهید شنید که به شما اطلاع می‌دهد حالت فعال شده است و همچنین صفحه‌خوان شما حالت فعال‌شده را به شما اطلاع می‌دهد.

درحالی‌که تصویر شما دارد به جِمینای ارسال می‌شود و جِمینای پاسخ آن را برمی‌گرداند، صدای بارگیری یا «لطفاً منتظر بمانید» را خواهید شنید. پس از دریافت، پاسخ در یک کادر محاوره‌ای به‌صورت متن ساده نمایش داده می‌شود. در اینجا می‌توانید پاسخ را بخوانید یا در صورت تمایل کپی کنید و کادر محاوره‌ای را ببندید.

حالت رابط کاربری کمی متفاوت است. بعد از اینکه یک عکس فوری از رابط کاربری برنامه گرفته می‌شود می‌توانید از کلیدهای تب و شیفت + تب برای گردش بین عناصر شناسایی‌شده از رابط کاربری استفاده کنید و کلید اینتر را برای فعال‌کردن یک عنصر خاص فشار دهید. بسته به تنظیمات شما ویوپوینت ممکن است منتظر بماند و سپس با فرض اینکه رابط کاربری تغییر کرده است یک عکس جدید از رابط کاربری بگیرد و آن را شناسایی کند.

برای خروج از این حالت به یک حالت دیگر از ویوپوینت بروید که باعث می‌شود حالت پیمایش در رابط کاربری بسته شود.

به طور کلی ویوپوینت به‌خوبی و با خطاهای کم کار می‌کند؛ اما برخی خطاهای مداوم وجود دارد که ممکن است لازم باشد آن‌ها را برطرف کنید. یکی از این مشکلات این است که اگر ویوپوینت را برای مدت طولانی بدون استفاده رها کنید به برخی از کلیدهای فشرده‌شده پاسخ نمی‌دهد یا ارسال اطلاعات به جِمینای را متوقف می‌کند.

کلید کنترل + شیفت + اف۴ برای بستن ویوپوینت در نظر گرفته شده است که باید در این شرایط از آن استفاده کنید؛ اما ممکن است لازم باشد کار بستن برنامه را از سیستم‌تری انجام دهید؛ زیرا در این شرایط فشردن کلیدهای مربوط به بستن برنامه اغلب بی‌پاسخ می‌ماند.

علاوه بر این، قبل از درخواست اطلاعات جدید از هوش مصنوعی حتماً پنجره‌های محاوره‌ای را ببندید؛ زیرا، یک پنجره محاوره‌ای باز گاهی اوقات می‌تواند باعث بروز رفتار عجیب‌وغریب شود.

دانلود و استفاده از ویوپوینت رایگان است و با سطح رایگان ای‌پی‌آی جِمینای سهمیه استفاده نسبتاً سخاوتمندانه‌ای دریافت می‌کنید. اگر توصیف تصویر هوش مصنوعی برای شما مفید است استفاده از این برنامه را توصیه می‌کنیم.

می‌توانید برنامه ویوپوینت را از اینجا دریافت کنید.

منبع شماره زمستان ۲۰۲۵ مجله اَکسِس‌وُرد

ترجمه و گردآوری: میثم امینی

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.

حاصل عبارت را در کادر بنویسید. *-- بارگیری کد امنیتی --