Görsel ve Görüntü — Claude Gözleriyle Görüyor

Claude görselleri görür ve akıl yürütür — metinlerle yaptığı düşünceyle aynı seviyede. Bu basit OCR (metin tanıma) değil, basit görsel tanıma değil. Görsel muhakemedir: bağlamı, ilişkileri ve anlamı görsellerden çıkarır.

Bu sayfa Claude’un görsellerle ne yapabildiğini ve bir iş profesyonelinin bunu nasıl kullandığını anlatır.

Claude Neleri Görür ve Analiz Eder?

Belgeler ve Görsellerdeki Metin

  • Fotoğraf, tarama ve ekran görüntülerinden metin okur ve çıkarır (OCR kalitesine eşdeğer veya daha iyi)
  • El yazısı notları işler (orta düzey doğruluk)
  • Standart olmayan düzenlerdeki metinleri okur: ekrandaki sözleşmeler, yazı tahtası fotoğrafları, fişler, kartvizitler
  • Belge görsellerinden tablolar, şekiller ve yapılandırılmış veri çıkarır

Grafikler ve Veri Görselleri

  • Çubuk grafik, çizgi grafik, pasta grafik, scatter plot okur ve yorumlar
  • Altta veri olmadığı durumlarda grafiklerden veri noktalarını tahmini olarak çıkarır
  • Görsel veriden trendler, anomaliler ve ana çıkarımları tarif eder
  • Tek analizde birden fazla grafiği karşılaştırır (tek turda 20 görsele kadar)

Fotoğraflar ve Gerçek Dünya Görselleri

  • Sahne içeriğini bağlamla yorumlar
  • Nesneleri, insanları (genel olarak tarif eder, isimle tanımlamaz), ortamları tespit eder
  • Ürün etiketlerini, ambalajları, tabelaları okur
  • Kalite kontrol amacıyla ürün fotoğraflarını analiz eder

Teknik Diyagramlar

  • UML diyagramları, akış şemaları, mimari çizimleri okur ve yorumlar
  • Süreç diyagramlarını ve organizasyon şemalarını anlar
  • Teknik şemaları analiz eder (CLAUDE.md’de alan bağlamı varsa)
  • Harita, kat planı, yerleşim diyagramlarından bilgi çıkarır

Ekran Görüntüleri ve UI Öğeleri

  • Uygulama ekran görüntülerini okur ve yorumlar
  • UI öğelerini, form alanlarını, düğmeleri, menüleri tespit eder
  • Ekranda ne olduğunu tarif eder — Computer Use için kritik
  • İki ekran görüntüsünü karşılaştırarak değişiklikleri belirler

Teknik Özellikler

ÖzellikDeğer
Desteklenen formatlarJPEG, PNG, GIF, WebP
Maksimum tur başı görsel (claude.ai)20
Maksimum API isteği başı100
Maksimum çözünürlük (Opus 4.7)2.576 piksel uzun kenarda (Claude’un desteklediği en yüksek)
Computer Use için optimum1080p (performans/maliyet dengesi)

Claude Görsellerle Ne Yapamaz?

  • Raster görsel üretmez (fotoğraf, illüstrasyon) — DALL-E veya Midjourney işlevi yok
  • Fotoğraftan belirli isimli kişileri tanımlamaz (gizlilik koruması)
  • Çok düşük çözünürlüklü veya kötü bozulmuş görsellerde mükemmel doğruluk beklenmesin

Ne üretebilir: SVG grafikler, React görsel bileşenler, HTML görsel düzenler, Mermaid diyagramlar — programatik görseller, raster değil. Artifacts sayfasında detayları var.

Departmana Göre Kullanım Senaryoları

DepartmanGörsel Kullanım Senaryosu
OperasyonTeslim edilen ürün fotoğrafı → kalite kontrol raporu; hasar fotoğrafı → NCR analizi
FinansFiş / fatura fotoğrafı → yapılandırılmış gider verisi; rapor ekran görüntüsü → anlatı
İnsan KaynaklarıTaranmış CV → yapılandırılmış aday profili; tahta organizasyon şeması → metin hali
HukukSözleşme sayfası fotoğrafı → madde çıkarımı; taranmış belgede imza / damga kontrolü
İdari İşlerKartvizit fotoğrafı → iletişim kaydı; tahta toplantı notları → yapılandırılmış minute
İhracat / TicaretMal, ambalaj, işaret fotoğrafları → sevkiyat inceleme notları; CIS belgeleri
Müşteri HizmetleriMüşterinin gönderdiği ürün fotoğrafı → sorun sınıflandırması ve yanıt
PazarlamaRakip reklam ekran görüntüsü → analiz; etkinlik fotoğrafı → sosyal medya caption

Pratik Örnekler

Kartvizit → CRM Kaydı

Konferansta 20 kartvizit aldınız. Fotoğrafları tek oturumda Claude’a gönderirsiniz:

“Bu 20 kartvizitten her birini CRM kaydı formatında yapılandır: Ad, Şirket, Pozisyon, E-posta, Telefon, Web. Excel tablosu olarak ver.”

Saatlerce sürecek elle yazma işi birkaç dakikaya iner.

Tahta Fotoğrafı → Toplantı Notu

Brainstorm toplantısı bitti, tahta dolu. Fotoğrafını çeker Claude’a gönderirsiniz:

“Bu tahta yazısını yapılandırılmış toplantı notuna çevir: ana başlıklar, alt maddeler, eylem kalemleri ayrı bölümde.”

Toplantıdan çıkmadan notlar hazırdır.

Fiş Fotoğrafları → Gider Raporu

20 fiş, farklı biçim ve dillerde. Hepsinin fotoğrafı:

“Bu fişlerden bir gider raporu çıkar. Her fiş için tarih, satıcı, tutar, KDV, kategori. Excel formatında.”

Mali müşavire gönderilecek dosya hazır.

Rakip Kampanyası Ekran Görüntüsü → Analiz

Instagram’da bir rakip kampanyası görmüşsünüz. Ekran görüntüsünü paylaşırsınız:

“Bu kampanyanın iletişim stratejisini analiz et: ana mesaj, hedef kitle, ton, çağrı, görsel yaklaşım. Bize nasıl uygulanır?”

Pazarlama toplantısına hazır bir brief çıkar.

Önemli Refleks

Çalışanların çoğu Claude’a fotoğraf verebileceğini bilmez. “Claude metin aracı” algısı hâkim.

Kartvizit → CRM girişi tek başına bir satış ekibi için “ya!” anıdır. Tahta → toplantı minutu bir yönetici asistanı için “ya!” anıdır.

Kendinize sorun:

“Bu bilgi elinde bir görselde mi var? Claude’a ver.”

O refleks kurulduğunda çalışan zamanını haftada saatlerce kazanır.

İlgili Sayfalar

  • Dosya İşleme — Görsellerin de bir dosya olduğu gerçeği
  • Computer Use — Ekran görüntülerinin en gelişmiş kullanımı
  • Artifacts — Claude’un ürettiği programatik görseller
  • Departmanlar — Her departman için özel kullanım örnekleri

Son güncelleme:

Görüşme Talep Et