Εργαλεία Χρήστη

Εργαλεία ιστότοπου


φυσική.γλώσα.ευρετηρίασης.μη.ελεχόμενο.λεξιλόγιο

Φυσική γλώσα ευρετηρίασης / μη ελεγχόμενο λεξιλόγιο

Σε αντίθεση με τις ελεγχόμενες γλώσσες ευρετηρίασης, η φυσική γλώσσα ευρετηρίασης εστιάζει στους όρους κάθε τεκμηρίου που περιγράφει. Αυτό πρακτικά σημαίνει ότι μπορεί να εξαχθεί και να χρησιμοποιηθεί οποιοσδήποτε όρος από το τεκμήριο προκειμένου να προσδιοριστεί το θέμα που αυτό πραγματεύεται. Αυτό καθιστά την αυτόματη ευρετηρίαση ιδιαίτερα απλή, αφού όλες οι λέξεις ενός τεκμηρίου χρησιμοποιούνται σαν πιθανοί όροι ευρετηρίασης. Κατά τη διαδικασία αυτή ο υπολογιστής επιλέγει όλες τις λέξεις ενός τεκμηρίου, αγνοώντας κοινές λέξεις, τις ονομαζόμενες “εξαιρουμενες” (stoplist). Παραδείγματα λέξεων αυτού του τύπου είναι τα εξής: το, σαν, μέχρι, αν, μη, εσύ, του, είναι κλπ. Πολλά από τα συστήματα που χρησιμοποιούν τη φυσική γλώσσα ευρετηρίασης καταμετρούν τη συχνότητα ύπαρξης των λέξεων αναζήτησης μέσα στο κείμενο. Όσο πιο πολλές φορές εντοπίζεται ένας όρος μέσα σε ένα τεκμήριο, τόσο αυτό αποκτά μεγαλύτερη βαρύτητα και θεωρείται σχετικό με τον όρο αναζήτησης. Ωστόσο, η φυσική γλώσσα ευρετηρίασης δεν επιλύει ζητήματα πχ. συνωνύμων, συνεπώς η συνάφεια του όρου αναζήτησης με τα τεκμήρια που ανακτώνται είναι αμφίβολη.

Τελευταία, έχει εμφανιστεί ο όρος ελεύθερη γλώσσα ευρετηρίασης (free indexing language). Ο όρος αυτός αναφέρεται στην απόδοση θεματικών προσδιορισμών σε ένα τεκμήριο με τη χρήση όρων που βρίσκονται μέσα σε αυτό (όπως στη φυσική γλώσσα), αλλά και άλλων, εκτός τεκμηρίου, που ο εισηγητής τους θεωρεί ότι εκφράζουν επίσης το θέμα του τεκμηρίου.

φυσική.γλώσα.ευρετηρίασης.μη.ελεχόμενο.λεξιλόγιο.txt · Τελευταία τροποποίηση: 2015/10/20 14:20 (εξωτερική τροποποίηση)