Skip to main content

Optik Karakter Tanıma (OCR) nedir?

Optik Karakter Tanıma (OCR) ve PDF / TIFF Dosya Formatı Desteği (Mayıs Ayı 2024)

Optik Karakter Tanıma (OCR) ve PDF / TIFF Dosya Formatı Desteği (Mayıs Ayı 2024)
Anonim

Optik Karakter Tanıma (OCR), bilgisayarların elle yazması veya metni girmesi gerekmeden okuyabileceği basılı, yazılı veya el yazısıyla yazılmış bir belgenin dijital bir sürümünü oluşturan yazılım anlamına gelir. OCR genellikle taranan belgeler üzerinde PDF formatında kullanılır, ancak bir görüntü dosyası içinde bir metnin bilgisayar tarafından okunabilir bir sürümünü de oluşturabilir.

OCR nedir?

Metin tanıma olarak da adlandırılan OCR, basılı veya yazılı belgelerden sayılar, harfler ve noktalama işaretleri (glifler olarak da adlandırılır) gibi karakterleri bilgisayar ve diğer yazılım programları tarafından daha kolay tanınan ve okunan bir elektronik forma dönüştüren yazılım teknolojisidir. Bazı OCR programları bunu bir belge tarandıktan veya bir dijital fotoğraf makinesiyle fotoğraflandıkça yapar ve diğerleri bu işlemi daha önce OCR olmadan taranan veya fotoğraflanmış olan belgelere uygulayabilir. OCR, kullanıcıların PDF belgeleri içinde arama yapmasına, metni düzenlemesine ve belgeleri yeniden biçimlendirmesine olanak tanır.

OCR Ne için Kullanılır?

Hızlı, her gün tarama ihtiyaçları için OCR büyük bir sorun olmayabilir. Çok miktarda tarama yaparsanız, ihtiyacınız olanı tam olarak bulmak için PDF'lerde arama yapabilmek oldukça uzun zaman kazandırabilir ve tarayıcı programınızda OCR işlevselliğini daha da önemli hale getirebilir. İşte OCR aşağıdaki konularda yardımcı olur:

  • Otomatik veri işleme ve veri girişi (Örnek: Özgeçmişler için iş başvuru takip sistemleri)
  • Taranan kitapların aranabilir hale getirilmesi
  • El yazısı taramalarını bilgisayar tarafından okunabilen metne dönüştürme
  • Görme engelli kullanıcılara yardımcı olan okuyucu programlarıyla belgeleri daha kullanışlı hale getirmek
  • Tarihi belgeleri ve gazeteleri korurken, onları da aranabilir hale getirme
  • Veri çıkarma ve muhasebe programlarına aktarma (Örnek: Makbuzlar ve faturalar)
  • Arama motorları tarafından kullanılacak indeksleme belgeleri
  • Sürücü kameralarının hız kamerası ve kırmızı ışıklı kamera yazılımı ile tanınması
  • Konuşamayan insanlar için konuşma sentezleyicileri - teorik fizikçi Stephen Hawking, belki de bir konuşma sentezleyici programının en tanınmış kullanıcısıdır

Neden OCR Kullanmalı?

Neden sadece fotoğraf çekmiyorsunuz, değil mi? Çünkü herhangi bir şeyi düzenleyemezsiniz ya da metni aramazsınız çünkü bu sadece bir görüntü olur. Belgeyi taramak ve OCR yazılımını çalıştırmak, bu dosyayı düzenleyebileceğiniz ve arama yapabileceğiniz bir şeye dönüştürebilir.

OCR tarihi

Metin tanımanın en erken kullanımı 1914'e kadar sürerken, OCR ile ilgili teknolojilerin geniş kapsamlı gelişimi ve kullanımı, özellikle dijital olarak okunabilir metne dönüştürülmek için daha kolay olan çok basitleştirilmiş fontların oluşturulmasıyla 1950'lerde ciddi bir şekilde başlamıştır. Bu basitleştirilmiş yazı tiplerinden ilki, David Shepard tarafından oluşturuldu ve yaygın olarak OCR-7B olarak biliniyordu. OCR-7B, bugün kredi kartlarında ve banka kartlarında kullanılan standart yazı tipi için finans sektöründe halen kullanılmaktadır. 1960'larda, çeşitli ülkelerdeki posta hizmetleri, Amerika Birleşik Devletleri, Büyük Britanya, Kanada ve Almanya dahil olmak üzere posta sıralamasını büyük ölçüde hızlandırmak için OCR teknolojisini kullanmaya başladı. OCR hala posta hizmetleri için postaları dünya çapında sıralamak için kullanılan temel teknolojidir. 2000 yılında, OCR teknolojisinin limitleri ve yetenekleri hakkında önemli bilgiler, botları ve spam yapanları durdurmak için kullanılan CAPTCHA programlarını geliştirmek için kullanıldı.

Yıllar boyunca, OCR yapay zeka, makine öğrenimi ve bilgisayar görüşü gibi ilgili teknoloji alanlarındaki gelişmeler nedeniyle daha doğru ve daha sofistike bir hale geldi. Bugün OCR yazılımı, belgeleri daha önce hiç olmadığı kadar hızlı ve doğru bir şekilde dönüştürmek için kalıp tanıma, özellik algılama ve metin madenciliği kullanmaktadır.