..:::وبلاگ تخصصی آموزش ودانلود نرم افزار:::..
آموزش و راه کارهای کامپیوتر -مقاله کامپیوتر-قالب -ویندوز XP- ویستا -رمز

منوی کاربری

وبلاگ را صفحه ی خانگی خود کنید ارسال ایمیل برای مدیر وبلاگ اضافه کردن به علاقمندی ها


پیغام مدیر :

بازدیدکننده ی عزیز ورود شما را خوش آمد می گویم . امیدوارم مطالب این وبلاگ مورد استفاده ی شما قرار گیرد و لحظات خوشی را در این وبلاگ سپری کنید . نقطه نظرات خود را برای بهبود وبلاگ مطرح نمایید .

خبرنامه





لوگو

©Copyright


Copyright © 2003-2010
Ali Faryabi


All rights reserved

www.alisalar.blogsky.com


آرشیو

مشاهده آرشیو


[خوش آمدید]

شنبه 16 آذر‌ماه سال 1387
تبدیل اسناد اسکن شده به متون نوشتاری‌

اشاره : اگر تاکنون دقت کرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.  


اگر تاکنون دقت کرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.

یکی از این ابزارها، قابلیت OCR یا Optical Character Recognition نام دارد که در قالب دو نرم‌افزار Microsoft Office Document Scanning و Microsoft Office Document Imaging در قسمت Office Tools قرار گرفته است. قابلیت OCR صفحه اسکن شده را تحلیل و سپس متون موجود در آن را استخراج می‌کند.

همان‌طور که می‌بینید روش کار واضح است. ابتدا باید اسناد مورد نظر خود را به فرمت TIFF یا Tagged Image File Format اسکن کنید و سپس به کمک قابلیت OCR، آن‌‌‌ها را به صورت Text درآورید. بدین ترتیب می‌توانید متون یک کتاب یا هر نوشته دیگری را در نرم‌افزار Word یا سایر نرم‌افزارهای آفیس وارد و آن‌ها را ویرایش کنید (این قابلیت تنها برای متون انگلیسی، فرانسه و اسپانیایی کاربرد دارد).
 
بدین منظور باید مراحل زیر را دنبال کنید:

íروی دکمه استارت کلیک کنید.
íعبارت All Programs را انتخاب کنید.
íعبارت Microsoft Office را انتخاب کنید.
íعبارت Microsoft Office Tools را انتخاب کنید.


íدر فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن کلیک کنید. اگر این عبارت وجود نداشت، باید آن را نصب کنید. بدین منظور سی‌دی نصب آفیس را در درایو سی‌دی قرار دهید. پس از نمایش صفحه Autorun، تیک عبارت Add or Remove Features را بزنید و روی دکمه Continue کلیک کنید. اکنون شما به صفحه سفارشی کردن نصب آفیس هدایت شده‌اید. روی علامت (+) کنار عبارت Office Tools کلیک کنید تا شاخه مربوطه باز شود.

در این قسمت، روی آیکون عبارت Microsoft Office Document Imaging کلیک کنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب کنید. با فشردن دکمه Continue، فرآیند نصب آغاز می‌شود. پس از پایان مراحل نصب، مراحل یک تا پنج را بار دیگر تکرار کنید تا کادر محاوره‌ای با عنوان Scan New Document نمایش داده شود.

íدر این پنجره می‌‌توانید یکی از تنظیمات پیش‌فرض را برای اسکن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پیش‌فرض و یا ایجاد تنظیمات پیش‌فرض جدید، می‌توانید روی دکمه Preset Options کلیک کنید و عملیات مورد نظر خود را (ساخت، ویرایش یا حذف تنظیمات پیش‌فرض) انتخاب کنید.

پیشنهاد می‌کنیم برای دستیابی به یک نتیجه مطلوب، تنظیمات پیش‌فرض اسکن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید. در عین حال اگر از چند اسکنر استفاده می‌کنید، می‌‌توانید با کلیک روی دکمه Scanner...، اسکنر مورد نظر خود را انتخاب کنید.

íپس از پایان تنظیمات اسکن، روی دکمه Scan کلیک کنید تا صفحه مورد نظر اسکن شود. اگر هنگام عملیات اسکن با پیغام خطایی مواجه شدید، به کادر Scan New Document بازگردید و در قسمت انتخاب اسکنر، تیک عبارت‌های Use Automatic Document Feeder و Show Scanner Driver Dialog Before Scanning را بزنید و برای تأیید تنظیمات روی دکمه Ok کلیک کنید.

íپس از پایان عملیات اسکن، روی دکمه Close کلیک کنید. اکنون صفحه اسکن شده در قالب فرمت تصویری TIFF و در نرم‌‌افزار Office Document Imaging Window نمایش داده شده است.

íاگر مایلید که تنها قسمت خاصی از این فایل را استخراج کنید، باید دکمه چپ ماوس را نگه دارید و آن را روی قسمت مورد نظر بکشید.

íدر بالای صفحه، منوی Tools را انتخاب کنید.
íزیرمنوی Send Text to Word را کلیک کنید تا پنجره مربوطه نمایش داده شود.

íبرای استخراج تمام متون فایل TIFF، تیک عبارت All Pages را بزنید. اما اگر می‌‌خواهید تنها متون انتخاب شده استخراج شوند، تیک عبارت Current Selection را بزنید.
اگر می‌خواهید خروجی عملیات تبدیل فایل TIFF به Text، فاقد تصاویر سند اسکن شده باشد، تیک عبارت Maintain Pictures in Output را بردارید.

íپس از اتمام تنظیمات مربوطه، روی دکمه Ok کلیک کنید. با این کار، نرم‌افزار Word باز شده و فایل TIFF در قالب سند نوشتاری (Text) نمایش داده می‌‌شود. در صورت نیاز می‌توانید آن‌ها را ویرایش کنید.

علاوه بر روشی که در بالا به آن پرداختیم، در نرم‌افزار Document Imaging می‌توانید فایل‌های TIFF را به Text تبدیل کنید. بدین منظور از منوی File عبارت ... Import را انتخاب کنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دکمه Import کلیک کنید. اکنون می‌توانید با طی کردن مراحل نه تا چهارده، متون فایل TIFF را استخراج نمایید.

باید به این نکته توجه داشته باشید که هنگام تحلیل یک صفحه توسط قابلیت OCR، احتمالاً با این پیغام خطا مواجه خواهید شد.

Unable to perform OCR in Farsi: این پیغام زمانی نمایش داده می‌شود که زبان انتخابی پیش‌فرض سیستم شما، فارسی باشد. برای رفع این مشکل از منوی Tools نرم‌افزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی کرکره‌ای OCR Language، زبان English را انتخاب کنید.


لینک های مفید

روزانه

نظرسنجی

آمار بازدید کنندگان

تعداد بازدیدکنندگان : 535062


رتبه وب لاگ

 

کپی برداری از مطالب وبلاگ فقط با ذکر منبع مجاز می باشد .