WordPress DemoSite

Тестовый сайт для экспериментов и демонстраций возможностей

YAGO (Yet Another Great Ontology) — база знаний на основе семантических технологий

YAGO — это онтологическая база знаний, созданная путем автоматического объединения данных из Википедии, WordNet и GeoNames. В отличие от Wikidata и DBpedia, YAGO уделяет особое внимание качеству данных и их связи с лингвистическими ресурсами.

🔹 Официальный сайт: https://yago-knowledge.org/


🔹 Для чего используется YAGO?

  1. Семантический веб и Linked Data
  1. Искусственный интеллект и NLP
  1. Академические исследования
  1. Поисковые системы и рекомендации

🔹 Какие данные есть в YAGO?

YAGO содержит более 10 млн сущностей и 120 млн фактов, включая:

Тип данныхПримеры
ЛюдиУченые, политики (связи, даты жизни)
МестаГорода, страны (координаты, иерархия)
ОрганизацииКомпании, университеты (основатели, даты)
СобытияВойны, научные открытия (участники, даты)
Лингвистические данныеСвязи с WordNet (синонимы, категории)

Пример данных в YAGO


🔹 Как получить данные из YAGO?

1. SPARQL-запросы

Доступ через SPARQL-эндпоинт:

SELECT ?person WHERE {
  ?person yago:hasWonPrize yago:NobelPrize .
}

(Находит всех лауреатов Нобелевской премии)

2. Скачивание дампов

🔹 Форматы: RDF, TSV, Turtle
🔹 Ссылки: https://yago-knowledge.org/downloads

3. Интеграция с Python (RDFlib)

from rdflib import Graph
g = Graph()
g.parse("yago_data.ttl", format="turtle")
for subj, pred, obj in g:
    print(subj, pred, obj)

🔹 Сравнение YAGO с Wikidata и DBpedia

КритерийYAGOWikidataDBpedia
Источник данныхВикипедия + WordNet + GeoNamesРучное редактированиеАвтопарсинг Википедии
Качество данныхВысокое (ручная проверка)Зависит от редакторовСреднее (возможны ошибки)
Лингвистика✅ Интеграция с WordNet❌ Нет глубокой лингвистики❌ Нет
SPARQL✅ Полная поддержка✅ Полная поддержка✅ Полная поддержка

🔹 Плюсы и минусы YAGO

Преимущества:

Недостатки:


Вывод

YAGO — лучший выбор, если вам нужно:
Высококачественные данные с ручной проверкой
Лингвистические связи (WordNet)
Семантическая совместимость (RDF, SPARQL)

Если нужен максимальный охват — выбирайте Wikidata.
Для автоматического парсинга ВикипедииDBpedia.

Полный стэк: .NET | AMQP | Android | api | Bash | Bootstrap | C++ | cms | Composer | css | Data | Elasticsearch | ESP32 | Git | GraphQL | Gulp | JavaScript | JetStream | Joomla | js | Kotlin | Laravel | LEMP | Linux | LMS | Markdown | MODX | Moodle | MySQL | NATS | Nginx | Node.js | OpenCart | Parsedown | PHP | Python | RabbitMQ | SCSS | SEO | Simpla | SOAP | SQL | startup | Swift | Symfony | Tailwind | Translation | Twig | Ubuntu | Unit | web3 | Webasyst | Webpack | WebSocket | WordPress | XML | Бизнес | блокчейн | ИИ | интернет-магазин | ЛК | Руководство | ТЗ | фреймворк | Яндекс.Трекер