IPS Bilgi erişim sistemlerinin amacı ve işlevleri

İçindekiler:

IPS Bilgi erişim sistemlerinin amacı ve işlevleri
IPS Bilgi erişim sistemlerinin amacı ve işlevleri

Video: IPS Bilgi erişim sistemlerinin amacı ve işlevleri

Video: IPS Bilgi erişim sistemlerinin amacı ve işlevleri
Video: электричка в Челябинске 2024, Nisan
Anonim

Modern bir insanın internet ve bilgi kaynaklarına neredeyse anında erişim olmadan bir hayatı hayal etmesi zordur. Kullanıcı, ağda istenen içeriği aramanın nasıl yapıldığını nadiren düşünür. Ama bu çok ilginç.

Bilgi alma sistemi (IPS), kullanıcının isteği üzerine bilgileri seçen karmaşık bir yazılım ve donanım sistemidir. Bilgiler, eskiden kitapların kütüphane raflarında olduğu gibi, dijital ortamda sunucularda saklanır. Sistem birçok alt sistemden oluşmaktadır. Her biri, kullanıcının talebini işleme ve ona metin veya ses biçiminde bilgi sağlama sürecinde görevini yerine getirir. Çözülecek görevlerin çokluğu, modern bilgi erişim sistemlerinin (bilgi erişim sisteminin bir kıs altması) mimarisinin karmaşıklığını belirler. Bir tür "kara kutu": girişte - isteğin metni, içinde ne olduğu - bilinmiyor, çıktıda - kapsamlı bilgi.

Gerçek hayatta kart dosyası
Gerçek hayatta kart dosyası

Giriş akışları

Bir kişinin gadget'ının ekranında metin biçiminde oluşturduğu bilgi talepleri,arama motoru tarafından işlenen isteklerin küçük bir bölümünü oluşturur. Arama sorgularının ana dizileri, bir insan talebini kabul eden ve kullanıcıyla çok adımlı bir arama ve geri bildirim gerçekleştiren robotlar tarafından oluşturulur. Bilgi alma sistemleri arasında iyi bilinen Google, Yandex ve diğerleri yer alır ve her gün milyonlarca istek işlenir.

Kaynak arama nesneleri

Arama için ilk ilgilenilen nesneler kümesi belgeler, kayıtlar, videolar, resimler ve daha fazlasını içerir. IPS'nin dışında oluşturulurlar. Genel bilgi depolama ve alma sisteminde yerleşik bir bibliyografik sistem olmalıdır - her tür nesneyi aramanıza izin veren bir tür katalog.

Nesneler veya bunların dijital dönüşümleri, IPS'ye "giriş kaynağı" haline gelir. Kullanıcının ihtiyacı olan bilgiler de bunlar arasından seçilir.

bilgi ara
bilgi ara

Dış kaynaklar

Bilgi seçimi görünümü harici bilgi kaynaklarını kullanır. Bu, kullanıcının aradığı bilgidir. Filmin adı, kitaptan bir alıntı ve daha fazlası. Bir bilgisayar araması için bu bilgi, algoritmik bir dilde bir sorguya çevrilmelidir. IPS'de bu, sorgu oluşturma, indeksleme ve geliştirme bloğu kullanılarak yapılır.

İdeal olarak, bu üç süreç-temsil, indeksleme ve sorgu geliştirme-aynı bilgi kaynaklarına dayanmalıdır, ancak pratikte bu başarılamaz.

Bilgi kaynakları sürekli gözden geçirilmeli ve güncellenmeli ve güncelleme aynı vesenkronize. Ve harici bir bilgi kaynağı, arama motorlarında bir sorgu için kullanılmasından her zaman kronolojik olarak, bazen birkaç yıl önce gelir.

Bilgi alma sistemi
Bilgi alma sistemi

Performans

Orijinal nesnelerin temsilleri, belirli bir bilgi alma sisteminin kural ve algoritmalarına göre bazı kombinasyonlarda veya dönüştürülmüş girdi verilerinden oluşur.

Görünümler, orijinal arama nesnesinin aşağı yukarı dönüştürülmüş kopyalarıdır. Düzenlenmemiş tam metinler koleksiyonunda, her metin kendi temsilidir. Müze sergilerinin ve eserlerin nesnelerinin koleksiyonunda, temsil, nesnenin imajıyla birlikte dönüştürülmüş bir açıklaması olabilir. Bazı durumlarda, temsil kısmen orijinal nesneden ve kısmen de açıklamadan türetilebilir: bibliyografik arama motorlarında temsiller nesneden türetilir - örneğin, başlık, yazarın adı çalışmanın notuyla birleştirilir.

İhtiyacınız olanı bulmak
İhtiyacınız olanı bulmak

Aranabilir dizin

Bilgi erişim sistemlerindeki bilgiler bir temsil şeklinde saklandığından, aramanın gösterime göre yapıldığını ve seçimden sonra kullanıcıya verildiğini varsaymak mantıklıdır. Uygulamada, durum böyle değil. Örneğin, mevcut çevrimiçi kütüphane katalogları, aramaları genellikle birkaç alanla sınırlandırır: yazar, başlık ve aranmayan diğer alanları içeren bir görünümdeki altyazılar. Ayırt etmenin gerekli olması için bu yeterli bir nedendir.bir görünüm ve görünümün arama kısmı olan aranabilir bir dizin. Aranabilir olması gereken her şeyi tanımlar. Görünüm ve kaynak nesne gibi aranabilir bir dizin, daha kesin, hedefli aramalar sağlamak için ayrı alt dizinlere bölünebilir

Arama motorları genellikle geçerli arama sonuçlarını eşleştirmek için dahili olarak sentetik bir yapıya sahiptir. Bu yapı, aranabilir dizinin ikinci bileşenidir.

Yöntemsel olarak, dizin oluşturma işlemi farklı şekillerde uygulanabilir: aranabilir bir dizin şu şekilde elde edilebilir:

  • aranabilir bir gösterimi kelimenin tam anlamıyla kopyalamak;
  • görünüm ayrıntılarını kopyalayarak. Bu, gerektiğinde toplanacak olan, arama için bir dizin oluşturma kurallarına göre dağıtılan, yalnızca parçalar olarak fiziksel olarak var olan görünümlerin bir kısmı veya tamamı olabilir.
Arama yönetimi
Arama yönetimi

Tasarım Kuralları ve Resmi İstekler İste

Sorgu mühendisliği, bir kullanıcı sorgusu ile resmi bir sorgu arasında aracılık eden bir işlevdir. Kullanıcının sorgusunu, geri alma komut sözlükleri, dizin belirtimi ve alınmadan önce dizinle eşleştirerek dönüştürür. IPS'nin gelişiminin başlangıcında, bu rol geleneksel olarak kalifiye BT uzmanlarına verildi.

Sözlük sorgularını aranabilir bir dizin sistemiyle eşleştirebilen bilgisayar sorguları geliştirmeye genellikle "sözlük girişi" modülü denir. Bu işlevin otomasyonu umut vericidir ve uzman ve olasılıklı arama yöntemleri için fırsatlar sunar.

Resmi bir istek, kullanıcının isteği dönüştürüldükten sonra resmi bir istek haline gelir. Bu tür biçimsel dönüşümlerin örnekleri arasında kıs altma, ikame, normalleştirme, vektörleştirme ve "dış" temsilin bilgisayar IPS'sinin (şifre çözme - bilgi alma sistemi) "dahili" temsillerine diğer dönüşümleri yer alır.

Çıkarılan Belge Bağlantı Kümeleri

Sonuçlanan bilgi kaynakları kümesi, mantıksal olarak, aranabilir bir dizin tarafından resmi sorguya uygulanan eşleştirme kuralları tarafından oluşturulan görünümlerin bir alt kümesidir.

Genellikle, ancak zorunlu olarak değil, kurtarılan bilgi kümesi için ayrı bir sıralama işlemi vardır. Çevrimiçi kütüphane katalogları genellikle, alınan setleri görüntülemeden önce yazar tarafından alfabetik olarak yeniden sıralar. Kesin sıralamalar üreten bilgi erişim sistemlerinde, sıralama düzeni herhangi bir yeniden sıralamadan önce gelir.

Veri analizi
Veri analizi

Çıkış akışları

Arama sonuçlarının çıkışı geleneksel olarak ekranda yapılır, daha sık olarak başka bir yerde veya başka bir amaç için kullanılacak bir nesne akışı şeklinde, ana arama döngüsünü tamamlar. Bu tür akışlar görselleştirme cihazlarına gönderilebilir, daha fazla işlem için depolama veya diğer seçim hizmetlerine giriş akışları olarak kullanma.

Bilgi alma sistemleri,herhangi bir seçim sürecinin çıktısı. Herhangi bir sürecin çıktısı, diğer süreçlere geri bildirim olabilir. Geri bildirim, herhangi bir aşamada uzman kararı için temel sağlayabilir.

Önerilen: