کاوش در منابع تصویری نورمگز

کاربران نورمگز کلمات مورد جستجوی خود را در منابع تصویری این پایگاه نیز می یابند

جستجو در تصویر منابع

تبدیل تصویر به متن یکی از شیوه‌های اساسی در جستجو پذیر کردن منابع تصویری است به‌نحوی‌که با استفاده از متن OCR شده در موتور جستجو و شناخت و رنگی کردن کلمات جستجو شده در تصویر، این امکان برای محقق فراهم می شود تا بتواند در منابع تصویری نیز کلمات مورد نظر خود را جستجو کند.

ocr فـناوری تـبدیل تصاویر گرفته شده از‌ متن‌ به خود متن اسـت.خـروجی‌ حاصل‌ از این‌ فناوری‌،دو‌ اشکال بزرگ ذخیره و بازیابی مدارک یعنی مشکل حجم بالای تصاویر و مشکل جستجو در متن منابع تصویری
را‌ حل می‌کند.

نرم‌افزارهای OCR قادرند‌ تـصاویر‌ پویـش شـده از متن را به‌ میلیون‌ها نقطهء نوری تبدیل‌ کنند‌. به این تـرتیب،نرم‌افزار می‌تواند‌ یک‌ درک محاسباتی از صفحهء پویش شده برای خود ایجاد کند و نقاط سفید صفحه‌ را‌ صفر و نقاط تاریک یـا هـمان‌ نـوشته‌های‌ متنی‌ را یک فرض‌ کند‌.حال،نرم‌افزار می‌تواند نقاط‌ تاریک‌ یا نـوشته‌ها را بـا الگوهایی از حروف که از قبل درنرم‌افزار ذخیره شده یا‌ به‌ آن آموزش داده شده،مقایسه کرده‌ و حدس‌ بزند کـه‌ هـرکدام‌ از‌ ایـن سلسله نقاط تاریک‌ شبیه کدام حرف از حروف فارسی یا انگلیسی است و آنـگاه آن حـرف را در یـک‌ فایل‌ متنی قراد داده و برای تمام نقاط‌ تاریک‌ عکس‌،همین‌ فرایند‌ را ادامه می‌دهد‌ تا‌ مـتن کـامل از تـصویر به دست آید. طبیعتا این نرم‌افزار از نقاط سفید یا صفر صفحه‌ برای‌ ایجاد‌ حـاشیه‌هایی کـه در صفحات وجود دارند و همچنین‌ برای‌ فاصله‌گذاری‌ میان‌ کلمات‌ استفاده‌ می‌کند.

به این تـرتیب،نـرم‌افزار تـصاویر رقومی شده را به یک تصویر قابل پردازش تبدیل می‌کند.حال،ما می‌توانیم هرچیزی را به سـادگی در مـتن جدید تولید‌ شده جست و جو کنیم….توضیحات بیشتر را در مقالات زیر بیابید:

OCRفناوری تبدیل تصویر متن به خود متن (به زبان ساده)

او. سی. آر و کاربردهای آن در کتابخانه ها و مراکز اطلاع رسانی

یک دیدگاه