Görsel ve Dilsel Temsillerin Vektör Uzayında Hizalanması: CLIP' Giriş

CLIP (Contrastive Language-Image Pre-training): Çok Modlu Temsil Öğrenimi CLIP Nedir ve Neden Önemlidir? CLIP, görüntüleri metinle ilişkilendirerek nesne tanıma ve sınıflandırma yapar. CLIP, görsel ve dil (metin) verilerini birleştiren çok modlu (multimodal) bir yapay zeka modelidir. İnternet ölçeğinde, resim ve resim altı yazılarından (caption) oluşan 400 milyonluk devasa bir veri seti üzerinde eğitilmiştir. Gerçek hayatta güvenlik (örn. maske tespiti), karmaşık sahne analizi (örn. sisli dağdaki balon) ve genel görsel sınıflandırma gibi alanlarda kullanılır. CLIP doğrudan görsel arama (retrieval) sistemlerinde kullanılır. Kullanıcının yazdığı metni anlayıp veritabanındaki en alakalı görseli bulabilir; model kartında bu yetenek açıkça “retrieval and embedding tasks” olarak belirtilmiştir. ...

3 February 2026 · 3 min · Esra Cüm

C++ ve OpenCV ile Gerçek Zamanlı Nesne Algılama

Proje Hakkında Bu proje, görüntü işleme süreçlerinde performansın kritik olduğu durumlar için C++ ve OpenCV kütüphanesi kullanılarak geliştirilmiştir. Python tabanlı çözümlere göre daha düşük gecikme süresi (latency) ve daha yüksek FPS değerleri sunarak gerçek zamanlı analiz yapabilmektedir. Özellikle İHA sistemleri gibi kısıtlı donanım kaynaklarına sahip platformlarda nesne algılama süreçlerini optimize etmek amacıyla tasarlanmıştır. Proje Demosu Aşağıdaki videoda sistemin gerçek zamanlı çalışma performansını izleyebilirsiniz: --- Teknik Detaylar ve Teknolojiler Dil: C++ Kütüphane: OpenCV (Open Computer Vision Library) Derleme Sistemi: CMake Algoritma: [Buraya kullandığın algoritmayı ekle: örn. YOLOv8, Haar Cascade veya MobileNet-SSD] Öne Çıkan Özellikler Gerçek Zamanlı Performans: C++ sayesinde optimize edilmiş kare işleme hızı. Çoklu Nesne Algılama: Aynı anda birden fazla sınıfı (insan, araç vb.) tanıma yeteneği. Görüntü İşleme Hattı (Pipeline): Ham görüntünün alınması, ön işlemesi (preprocessing) ve sonuçların görselleştirilmesi. Kaynak Kodları Projenin tüm kaynak kodlarına ve teknik dökümantasyonuna GitHub üzerinden ulaşabilirsiniz: ...

5 January 2026 · 1 min · Esra Cüm