Gittikçe daha fazla fiş hiç kağıda dokunmuyor. Uber ücretiniz, Airbnb konaklamanız, AWS faturanız, GitHub aboneliğiniz — hepsi e-postanızda veya başka bir uygulamada PDF olarak geliyor. Yalnızca kamerayla çalışan bir fiş tarayıcı, modern harcamanın yarısını kaçırır. İşte PDF fişleri Android'de ele almanın neden gerçekten zor olduğuna ve Enceipt'in işleme hattının onlarla nasıl başa çıktığına bir bakış.
PDF taraması kamera taramasından neden farklı
Kağıt bir fişi fotoğrafladığınızda, uygulama bir görüntü üzerinde optik karakter tanıma (OCR) çalıştırır: piksellerde metin bulması, ışık, eğiklik ve buruşuklukla başa çıkması gerekir. Bir PDF daha kolay görünür — metin orada öylece duruyordur, değil mi? Bazen. Ama "PDF" çok farklı iki şeyi kapsar ve bu fark çok önemlidir.
- Metin tabanlı PDF'ler gerçek, seçilebilir metin içerir. AWS, GitHub, Adobe veya Notion'dan gelen faturalar genellikle böyledir. Metin, OCR'ye gerek kalmadan doğrudan çıkarılabilir — hızlı ve doğru.
- Görüntü tabanlı PDF'ler aslında yalnızca bir PDF kabına sarılmış bir fotoğraftır. Taranmış bir kağıt fatura ya da birinin fotoğraflayıp "PDF olarak kaydet" dediği bir fiş, çıkarılabilir hiç metin içermez. Onu okumak için, tıpkı bir kamera çekiminde olduğu gibi, gömülü görüntü üzerinde OCR çalıştırmanız gerekir.
İyi bir PDF tarayıcı, hangi türle uğraştığını algılamalı ve buna göre yönlendirmelidir. Bir görüntü PDF'ini metin gibi ele alırsanız hiçbir şey elde edemezsiniz; bir metin PDF'ini görüntü gibi ele alırsanız doğruluğu çöpe atarsınız.
Ortak sorunlar
Metin-görüntü ayrımının ötesinde, PDF fişleri kendi baş ağrılarını getirir:
- Çok sayfalı faturalar. Bir otel hesap özeti veya bir bulut faturası birkaç sayfa sürebilir; toplam son sayfada, satır kalemleri ise geri kalanına yayılmış olur. Yalnızca ilk sayfayı kapmak, önemli olan sayıyı kaybetmektir.
- Tutar-adres karışıklığı. Yolculuk paylaşımı fişlerinde olduğu gibi, PDF'ler toplam olmayan sayılarla doludur: posta kodları, telefon numaraları, fatura kimlikleri, sipariş numaraları, rakam olarak yazılmış tarihler. "En büyük sayıyı" seçmek hata reçetesidir.
- Tutarsız düzenler. Her satıcı farklı biçimlendirir. "Toplam", "Ödenecek tutar", "Genel toplam", "Karta tahsil edildi" — gerçek rakamı işaretleyen etiket değişir ve bazen birden fazla aday toplam (ara toplam, vergi, toplam) bulunur.
Enceipt'in yaklaşımı
Enceipt, paylaşılan bir belgeyi tek bir tahmin değil, bir işleme hattının başlangıcı olarak ele alır.
İlk olarak, belge türünü algılar. PDF'in çıkarılabilir bir metin katmanı varsa, Enceipt onu doğrudan okur. Yalnızca görüntü içeren bir PDF ise, Enceipt sayfayı işler ve kamerada kullandığı aynı cihaz üzerindeki OCR'yi çalıştırır. Her iki durumda da metin tek bir yerde toplanır.
Ardından bölge duyarlı ayrıştırma uygular. En büyük sayıyı taramak yerine, ayrıştırıcı fiş anatomisini anlar — satıcı kimliğinin, satır kalemlerinin ve toplamların nerede durma eğiliminde olduğunu ve hangi etiketlerin gerçekte ödenen tutarı işaretlediğini. Posta kodu, telefon numarası veya sipariş kimliği gibi görünen sayıları değersizleştirir ve çok sayfalı belgelerde erken bir ara toplam yerine nihai toplamı arar.
Gerçekten zorlu belgeler için Pro kullanıcıları kendi yapay zeka sağlayıcılarını getirebilir. OpenAI, Anthropic Claude, Google Gemini veya kendi sunucusunda barındırılan bir Ollama uç noktası için bir anahtarla Enceipt, zor bir düzeni çözmek üzere çıkarılan metni (asla görüntüyü, asla kart numaralarını değil) o sağlayıcıya gönderebilir — ve çağrı zaman aşımına uğrarsa cihaz üzerindeki ayrıştırıcıya geri döner.
Herhangi bir uygulamadan paylaşın — indirme dansı yok
En güzel kısım, ne kadar az sürtünme olduğudur. PDF'i indirmek, bir dosya uygulamasında bulmak ve içe aktarmak zorunda değilsiniz. Android'de basitçe paylaşım sayfasını kullanırsınız:
- Uber, Airbnb, e-posta istemciniz veya fişi tutan herhangi bir uygulamada Paylaş'a dokunun.
- Enceipt'i seçin.
- Enceipt belgeyi cihazınızda işler ve inceleme ekranını satıcı, toplam ve tarih doldurulmuş olarak açar.
Her şey yerel olarak gerçekleşir. PDF telefonunuzda okunur; açıkça bir BYOK yapay zeka sağlayıcısı yapılandırmadığınız ve onu kullanmayı seçmediğiniz sürece hiçbir şey yüklenmez.
Desteklenen kaynaklar
İşleme hattı, satıcıya özel kestirme çözümler yerine genel PDF işlemenin etrafında kurulduğundan, aşağıdakiler de dahil olmak üzere geniş bir gönderici yelpazesiyle çalışır:
- Uber ve Lyft
- Airbnb ve Booking.com
- AWS, GitHub, Adobe, Notion, Zoom ve Slack
- Amazon sipariş özetleri ve sayısız standart fatura
Bir uygulama bir PDF üretebiliyor veya paylaşabiliyorsa, onu genellikle Enceipt'e aktarabilirsiniz.
Neden gizli kalır
Enceipt'in yaptığı her şeyin ana fikrini yinelemekte fayda var: belge, çıkarılan metin ve ortaya çıkan masraf, hepsi cihazınızda kalır. Hesap ve sunucu tarafı depolama yoktur. Enceipt'e düşen bir PDF fiş, şifreli bir yerel kayda dönüşür — ve hazır olduğunuzda, muhasebeciniz için temiz bir PDF ya da CSV raporunun parçası olur.
Deneyin
Fişleriniz kağıt kadar sık PDF olarak geliyorsa, her ikisini de işleyen bir tarayıcıya ihtiyacınız vardır. Enceipt bunu cihaz üzerinde, saniyeler süren bir paylaşım sayfası akışıyla yapar.