yapay zekanın geleceği

Bir API kullanarak, yüzler, logolar veya servis şartları ihlallerinin saniyeler içinde görüntülenmesi için Google Cloud Vision veya Amazon Rekognition’a bir resim kütüphanesini yükleyebilir ve resim basına cüzi paralar ödeyebilirsiniz. Artık herhangi bir isletme, Google Photos ve Amazon Prime Photos tarafından kullanılan teknolojiyi, akıllı telefon snap’lerini otomatik olarak kategorilere ayırıp, bunların içindeki insanlar, nesneler ve işaretler temelinde dağıtabilir. Emlak şirketleri, muhtemel ev alıcılarına onları memnun edecek evleri aramalarına izin vermek için görüntü tanımayı kullanıyorlar. Kia gibi otomobil şirketleri, insanların sosyal medyada yayınladıkları fotoğraflara dayanan pazarlama kampanyalarını özelleştirmek için Al’ı kullanıyor. Şehirler, trafik modellerini anlamak ve altyapı projeleri hakkında daha iyi kararlar almak için teknolojiyi kullanabilirler. Bunlar gibi örnekleri çoğaltmak mümkün.

Tüm bunlar harika, devrimci ve ölçeklenebilir görünüyor, ancak diğer metalastırılmıs teknolojilerde olduğu gibi, hazır olan, her seye tek boyutlu yaklaşım tüm şirketler veya is hedefleri için ise yaramamaktadır, bu da su soruyu gündeme getirmektedir: Al ihtiyaçlarınız için, ticari bir bulut Al servisini mi seçersiniz yoksa daha kapsamlı bir özel çözümü mü tercih edersiniz? Al, kurumlar için giderek daha kritik hale geldikçe, üç temel seçenek ortaya çıktı:

  1. Amazon Al (Rekognition’ı içeriyor),

Clarıfai, CloudSight, Google Cloud Vision, IBM Watson veya Microsoft Cognitive Services gibi ticari bir Al-aaS servisinin kullanımı. Bunlar, doğal dil islemenin (NLP) yanı sıra, metin ve görüntü tanıma için çoğunlukla API’lar yoluyla izin verilen, nispeten dar bir Al fonksiyonları yelpazesi sunuyorlar.

  1. Daha geniş ve daha özelleştirilmiş bir dizi dikey Al servisinde uzmanlaşmış üçüncü parti uygulamacı Al şirketlerinin kullanımı. Bu, bazen verilerini bulutta paylaşmak istemeyen veya finans, sağlık hizmetleri, pazarlama veya perakende gibi belirli bir sektöre odaklanan Şirketler için kendi içlerinde bir çözümü içerir.
  2. Kendi uzmanlarınızı ve verilerinizi kullanarak eksiksiz bir makine öğrenme sistemini sıfırdan oluşturma. Bu, en karmaşık seçeneklerden biridir ve öncelikle Al’ın, çekirdek değerleri ve gelirleri için temel oluşturduğu kuruluşlar içindir.

Bu seçeneklerin her biri, belirli türde kurumsal kullanıcılar için anlamlıdır. Tam olarak hangisinin sizin için en iyi seçenek olduğu ise, aşağıdaki soruları nasıl yanıtladığınıza bağlıdır.

  1. Ne tür Al işlerinin yapılmasına ihtiyacınız var?

Al, tahmini analitik, öngörme, süreç optimızasyonu, kişiselleştirme ve diğerleri gibi geniş bir is durumları yelpazesinde yardımcı olur. Ancak, IBM Watson, bazı ek analitik ve dil isleme araçları sunarken, birçok ticari Al- aaS üreticisi, makine öğrenimi ile en yaygın şekilde ilişkilendirilen görevlere odaklanmışlar:

metin ve görüntü tanıma. Bunlar, Al çevresinde dönmeyen ana işlevlere sahip kuruluşlar için belirli, dar görevler için kullanıma hazır çözümler olarak hizmet vermektedir – diyelim ki, yüz tanıma yoluyla bir fotoğrafa karsı resim verıtabanlarını hızlı bir şekilde taramak isteyen bir yerel kanun uygulayıcı makama veya sakıncalı içerik için yorum bölümlerim (veya görüntüleri) denetlemek isteyen içerik sitelerine servis verebilirler. Açıkça tanımlanmış görevlere veya muazzam miktardaki verilere (tescilli veya başka bir şekilde) ek olarak, başka herhangi bir veya daha fazla karmaşık Al gereksiniminiz varsa, uygulamacı bir Al is ortağı ile etkileşimde bulunmak veya kendi dahili tam istıflı Al kurulumunuza başlamak isteyeceksiniz.

  1. Ne kadarlık bir hacime çıkabilirsiniz?

Görüntü ve metin tanıma hizmetleri giderek ticarılesmektedir ve bazen de düşük hacimlerde ücretsizdir. Fakat bunları büyük ölçekte yapıyorsanız, maliyetler katlanarak büyüyebilir.

Küçük bir fotoğraf paylaşım servisi çalıştırdığınızı ve sakıncalı içerik içermediğinden emin olmak için ayda 10.000 adet görüntü taramanız ve analiz etmeniz gerektiğini varsayalım. Amazon Rekognıtıon’da bu 10 dolara mal olacak; Google Cloud Vision sizden $13,50 ücret alacaktır, ancak bunlar aynı zamanda etiket tespitim de içerirler (yani, resmin bir kedinin, bir bisikletin, bir simitin, vb. resmi olup olmadığının belirlenmesini de). Etiket tespiti, örneğin, belirli tipte kabinleri veya tezgahı olan mutfakları işaretlemek isteyen emlakçılar veya farklı cilt bozukluklarını belirlemek isteyen doktorlar için de yararlı olacaktır.

Ancak, kullanıcılarının günde 14 milyon resmi yükledikleri Pinterest ölçeğinde çalışıyorsanız, güvenli görüntü aramasının ekonomisi önemli ölçüde değişecektir.

Büyük hacimli görüntüler için sunulan daha düşük fiyatlı tekliflerde bile, bu büyüklükteki bir hizmet günde Google Cloud Vision ile $16.500, yani yılda $5,1 milyonun üzerinde bir maliyete sahip olacaktır. Amazon’un kullanımı günde $10,600’ü ve yılda da $2.3 milyon doları bulacaktır.

Tabii ki, Al’den sağlamasını istediğiniz bilginin ne kadar olduğuna bağlı olarak maliyeti de artar. En büyük indirimde Google Cloud Vision, metni bulmak için resim başına başka bir $0.0006’ı, artı yüzleri, logoları ve işaretleri saptamak için de aynı tutarı ekler. Bunlara etiketleme ve içerik taramasını da ekleyin, Pinterest ölçeğindeki bir servis yılda 17,6 milyon dolardan fazla harcama yapacaktır. Bu ucuz ticari bulut servisleri artık çok ucuz görünmüyorlar.

  1. Sonuçlar ne kadar iyi olmak zorunda?

Ticari Al-aaS makine öğrenim modelleri çok büyük veri setlerine karsı eğitilmiş olsa da – Google’ın Metropolitan Sanat Müzesi’nden BigQuery motorunu eğitmek için 200.000 görüntüyü kullanması gibi – bu her zaman doğru sonuçlar üretecekleri anlamına gelmez. Upwork yakın zamanda, hayvanların, insanların, metinlerin ve nesnelerin resimlerini etiketlemede ne kadar doğru olduklarını değerlendirmek için önde gelen altı görüntü tanıma APl’inin bir karşılaştırmasını yayınladı. Test bilimsel değildi, ancak sonuçlar büyüleyici idi.

Her bir Al motorunun tahminleri, bazı resimleri ve uzaktaki yerleri hedefliyordu, örneğin, hepsi bir caddede park edilmiş bir arabayı belirlemekte başarılı oldular, ancak bazıları iki kedi, Büyük Kanyon, bir sise şarap ya da bir kaldırımda duran üç kisi gösterildiğinde tökezlediler. Bir yük atını süren Batılı bir göçmenin gerçekçi portresi gösterildiğinde, Google CV bunu bir resim olarak tanımlarken, Watson bunun bir “deve yarısı” olduğunu söylüyor ve Mıcrosoft’un en iyi tahmini ise “bir kitabın üzerinde sörf yapan gerçekçüstü bir kisi” oluyordu. Uygulamalı bir Al çözümleri sağlayıcısı veya bir danışman ile (ya da kendi Al istifinizi çalıştırırken) yola devam etmenin büyük bir avantajı, makine öğrenim modellerim daha özelleştirilmiş yollarla eğitme ve sonuçların doğruluğunu artırmak için ince ayar yapma yeteneğidir, örneğin, bir şarap önerileri uygulaması olusturuyorsanız, bir siseyi “şarap” veya “kırmızı” olarak etiketlemek yerine, üretici, bölge veya mahsul gibi daha ayrıntılı bilgiler vermek isteyebilirsiniz. Ya da, eğer sadece kısmi olarak gösterildiklerinde bile sosyal medya görüntülerinde bira logonuzun otomatik olarak tanınmasını (yüz ve görüntü tanıma sürecinde zor bir durum) isteyen bir bira üreticisi iseniz, o zaman uygulamalı Al veya DIY tam istifli bir çözümden faydalanabilirsiniz.

  1. Ne kadar bir esnekliğe ihtiyacınız var?

Ticari Al-aaS, uygulamalı bir Al veya kurum içinde geliştirilen tam istifli bir çözümden çok daha az kontrol ve esneklik sağlar, örneğin, Amazon Rekognitıon binlerce görüntü etiketi sunar, ancak bunlar her zaman isinizin gereksinimlerini karşılamaz. Amazon, örneğin “mutfak” veya “lavabo” etiketini kullanabilir, ancak mutlaka “Kohl musluğu” veya “karo panosu” olarak adlandıramaz. Yem etiketler eklemek veya Amazon’un görüntüleri potansiyel olarak sakıncalı içerikleri işaretleme seklini değiştirmek için, istekte bulunmanız gerekir. Amazon, yeni türdeki yumuşatılmış içerikleri eklemek için altı ila sekiz haftaya ihtiyaç duyuyor ve tüm istekleri karşılamaya da söz vermiyor. bGoogle Cloud Vision, herhangi bir zamanda API aracılığıyla sağlayabileceğiniz resimlerin boyutuna ve sayısına her zaman sınırlar getirir ve tüm servisler kabul edebilecekleri dosya türlerini ve tanıyabilecekleri veri türlerini sınırlarlar. Amazon, örneğin sadece PNG ve JPEG dosyalarını kabul eder. Burada bahsedilen altı Al-aaS üreticisinden sadece üç tanesi, görüntü tanıma ile birlikte optik karakter tanıma (OCR) da sunmaktadır; Sadece Clarifaı, videoların yanı sıra fotoğrafları da kabul eder. Başka bir deyişle, tüm gayrimenkul resimleriniz RAW formatında ise, önce bunları dönüştürmeniz gerekebilir. Şarap şişelerinin resimlerindeki etiketleri okuyan bir hizmet istiyorsanız, OCR isteyeceksiniz.

Herhangi bir renkteki (siyah olduğu sürece) bir Model T’ye nasıl sahip olabileceğiniz hakkındaki eski Henry Ford montaj hattı, bir hizmet olarak Al ‘ye uygulanır – seçenekleriniz sınırlı olacaktır.

  1. Ne tür bir performansa ihtiyaç duyuyor sunuz?

Gecikme, hemen hemen gerçek zamanlı görüntü veya metin işlemeyi gerektiren uygulamalar için sinsi bir katildir. Clarifai, APl’ının ABD içinden gönderilen tek bir resim için 200 ila 400 milisaniyede yanıt verdiğine dikkati çekiyor; daha fazla resim veya video ekleyin veya mesafeyi artırın, gecikme süresi kötüleşir. Öte yandan.

CloudSight’ın, muhtemelen bazı görüntüleri elle etiketlemek için insan kitle kaynağına güvendiğinden, yanıt vermek için 6-12 saniye süreye ihtiyacı var.

Tüm bulut servislerinde olduğu gibi, güvenilirlik de bir sorun; metin veya görüntü işleme yeteneğiniz tamamen üçüncü taraf sunucuların kullanılabilirliğine bağlıdır.

Nadir AWS veya Google kesintisi nedeniyle zorluk çeken herkes bunun ne kadar sinir bozucu olabileceğini söyleyebilir. Bir uzamış kesinti bile çok fazladır.

Yerinde bir Al istifine sahip olmak, gecikme sorununu büyük ölçüde ortadan kaldıracak ve kullanılabilirlik konusunda size daha fazla kontrol sağlayacaktır.

  1. Kurum içinde ne kadar uzmanlığınız var?

Al mühendisleri büyük talep görüyor. Pek çok kuruluşun elinde gerekli yetenekler yok ve bu yeteneklerin işe alınması. Al alanına agresif bir şekilde yatırım yapan ve yenilikler yapan Google, Microsoft, Facebook ve Amazon gibi şirketler ile yarışmak demek.

En iyi Al mühendislerini işe almak için gereken kaynaklara sahip olsanız bile, belirli işlerinizde uzmanlığa sahip olanları bulmakta sorun yaşarsınız.

Yalnızca Al’ı işinize katmayı deniyorsanız veya müşterilere servis olarak temel düşük hacimli Al fonksiyonlarını sunmak istiyorsanız, bulut tabanlı servisler işe başlamak için iyi bir yol olabilir. Ancak, daha fazla ölçek, daha fazla esneklik, alan uzmanlığı, veri gizliliği veya bir ticari bulut servisinin sunmadığı servislere ihtiyacınız varsa ve tam bir Al ekibini şirket içinde oluşturmak ve elemanları işe almak için gereken istek ve kaynaklara sahip değilseniz, daha sonra üçüncü taraf bir uygulamalı Al sağlayıcısı bulmak muhtemelen daha iyi bir yol olacaktır.

Yükselmek bir iş ve teknolojik zorunluluk olsa da, Al sizin temel değeriniz ise, kendi tam Al istifinizi oluşturmak, uzun vadede kuruluşunuz için önemli ölçüde avantaj sağlayabilir. Ancak herkes için bir Al-aaS çözümü veya uygulamalı Al iş ortağı ile birlikte çalışmak çok önemlidir.

Harvard Business Review tarafından belirtildiği gibi, Al, buhar motoru, elektrik ve internet ile eşit bir dönüşümsel teknoloji olmaya hazırlanıyor. O trenin önünde gitmeyen kuruluşlar, tükenme tehlikesiyle karşı karşıya kalacaklardır.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Güvenlik Kodu * Time limit is exhausted. Please reload the CAPTCHA.