Pineda, L. A Model for Multimodal Reference Resolution [Модель мультимодального встановлення референції] / Luis Pineda, Gabriela Garza // Computational linguistics. – 2000. – Vol. 26. – No. 2. – Pages 139–193. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120100561665#.WIKLkH3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120100561665
Важливим аспектом інтерпретації мультимодального повідомлення є здатність визначити, коли один і той самий реальний об’єкт є референтом символів у різних модальностях. Наприклад, щоб зрозуміти підпис до картинки, потрібно розпізнати графічні символи, до яких відсилають іменники і займенники у тексті природною мовою. Цю проблему можна розглядати як проблему анафори; однак, на відміну від встановлення лінгвістичної анафори, коли антецеденти займенників вибираються із лінгвістичного контексту, під час інтерпретації текстової частини мультимодальних повідомлень антецеденти вибираються із графічного контексту. З цієї точки зору, встановлення мультимодальної референції є схожим на розв’язання анафори у різних модальностях. Інший погляд на цю проблему – уважати займенники у підписах до картинок дейктичними. При такому підході контекст інтерпретації терміну природної мови визначається як набір виразів графічної мови із добре визначеними синтаксисом і семантикою. Природна мова і графічні терміни розглядаються як переклади один одного подібні перекладам з однієї природної мови на іншу. Цей другий підхід покладено в основу представленої у статті теорії. У рамках цієї теорії розглядається відношення між мультимодальним представленням і просторовим дейксисом з одного боку і між мультимодальним міркуванням і розв’язанням дейксису з другого боку. Також розглядається інтегрована модель розв’язання анафори і дейксису у контексті інтерпретації мультимодального дискурсу.
Важливим аспектом інтерпретації мультимодального повідомлення є здатність визначити, коли один і той самий реальний об’єкт є референтом символів у різних модальностях. Наприклад, щоб зрозуміти підпис до картинки, потрібно розпізнати графічні символи, до яких відсилають іменники і займенники у тексті природною мовою. Цю проблему можна розглядати як проблему анафори; однак, на відміну від встановлення лінгвістичної анафори, коли антецеденти займенників вибираються із лінгвістичного контексту, під час інтерпретації текстової частини мультимодальних повідомлень антецеденти вибираються із графічного контексту. З цієї точки зору, встановлення мультимодальної референції є схожим на розв’язання анафори у різних модальностях. Інший погляд на цю проблему – уважати займенники у підписах до картинок дейктичними. При такому підході контекст інтерпретації терміну природної мови визначається як набір виразів графічної мови із добре визначеними синтаксисом і семантикою. Природна мова і графічні терміни розглядаються як переклади один одного подібні перекладам з однієї природної мови на іншу. Цей другий підхід покладено в основу представленої у статті теорії. У рамках цієї теорії розглядається відношення між мультимодальним представленням і просторовим дейксисом з одного боку і між мультимодальним міркуванням і розв’язанням дейксису з другого боку. Також розглядається інтегрована модель розв’язання анафори і дейксису у контексті інтерпретації мультимодального дискурсу.
Переклад Д. Попової, М. Погребної
van Deemter, K. On Coreferring: Coreference in MUC and Related Annotation Schemes [Про кореферентність: кореферентність у системі розмітки конференції з розуміння повідомлень і споріднених системах] / Kees van Deemter, Rodger Kibble // Computational linguistics. – 2000. – Vol. 26. – No. 4. – Pages 639–637. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120100750105966#.WIKMf33sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120100750105966
У статті стверджується, що розмітка «кореферентності», яка виконується, наприклад, учасниками конференції з розуміння повідомлень, виходить далеко за межі розмітки власне кореферентності. В результаті не завжди зрозуміло, які семантичні відносини маркує ця розмітка. У статті проаналізовано численні проблеми з цією розміткою і зроблено висновок про необхідність переосмислення завдання розмітки кореференції до її широкого застосування. Зокрема, запропоновано розділити завдання, виділяючи розмітку відносин власне кореференції з-поміж інших завдань, таких як розмітка зв’язаної анафори і взаємовідносин між підметом і предикативною іменною групою.
У статті стверджується, що розмітка «кореферентності», яка виконується, наприклад, учасниками конференції з розуміння повідомлень, виходить далеко за межі розмітки власне кореферентності. В результаті не завжди зрозуміло, які семантичні відносини маркує ця розмітка. У статті проаналізовано численні проблеми з цією розміткою і зроблено висновок про необхідність переосмислення завдання розмітки кореференції до її широкого застосування. Зокрема, запропоновано розділити завдання, виділяючи розмітку відносин власне кореференції з-поміж інших завдань, таких як розмітка зв’язаної анафори і взаємовідносин між підметом і предикативною іменною групою.
Переклад В. Коломієць
Mitkov, R. Introduction to the Special Issue on Computational Anaphora Resolution [Передмова до спеціального випуску, присвяченого розв’язанню анафори] / Ruslan Mitkov, Branimir Boguraev, Shalom Lappin // Computational linguistics. – 2001. – Vol. 27. – No. 4. – Pages 473–477. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342626#.WIPBMn3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342626
Анафора забезпечує зв’язність тексту і є феноменом, який активно вивчається і у формальній, і у комп’ютерній лінгвістиці. Правильна інтерпретація анафори є вкрай важливою для обробки природної мови. Наприклад, розв’язання анафори є ключовим завданням у інтерфейсах на базі природної мови, машинному перекладі, реферуванні текстів, видобуванні інформації, питально-відповідних системах і великій кількості інших прикладних програм з обробки природної мови.
Анафора забезпечує зв’язність тексту і є феноменом, який активно вивчається і у формальній, і у комп’ютерній лінгвістиці. Правильна інтерпретація анафори є вкрай важливою для обробки природної мови. Наприклад, розв’язання анафори є ключовим завданням у інтерфейсах на базі природної мови, машинному перекладі, реферуванні текстів, видобуванні інформації, питально-відповідних системах і великій кількості інших прикладних програм з обробки природної мови.
Переклад В. Коломієць
Stuckardt, R. Design and Enhanced Evaluation of a Robust Anaphor Resolution Algorithm [Розробка і вдосконалене оцінювання робастного алгоритму розв’язання анафори] / Roland Stuckardt // Computational linguistics. – 2001. – Vol. 27. – No. 4. – Pages 479–506. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342635#.WIPBQn3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342635
Уже відомо, що обмеження синтаксичної коіндексації має вирішальне значення для практичних підходів до розв’язання анафори. Оскільки, зокрема через синтакстичну неоднозначність, припущення про існування однозначного тлумачення синтаксису виявилося нереалістичним, у робастному розв’язанні анафори використовуються методи подолання цього недоліку.
У статті описано алгоритм ROSANA, який узагальнює перевірку обмежень коіндексації, щоб застосувати її до недосконалих синтаксичних описів, створених робастним новітнім парсером. За допомогою формальної оцінки на двох корпусах текстів різних жанрів і тематики показано, що ROSANA забезпечує ефективне робастне встановлення кореферентності. Крім того, за допомогою поглибленого аналізу доведено, що робастне впровадження заборони на кореферентність є майже оптимальним. Проведене дослідження свідчить, що у порівнянні з підходами на основі поверхневої попередньої обробки переважно нееврістична алгоритмізація заборони на кореферентність відкриває можливості для деякого поліпшення результатів. Більше того, показано що більш значного поліпшення результатів слід очікувати на інших ланках, особливо завдяки урахуванню жанру текстів при виборі стратегій ранжування.
Дослідження ефективності системи ROSANA значною мірою спирається на удосконалену методику оцінювання систем встановлення кореферентності, розробка якої є другим важливим доробком автора. На додаток до теоретико-модельної системи оцінювання, розробленої для оцінювання на конференції з розуміння повідомлень, визначено додаткові показники оцінювання, які, з одного боку, підтримують розробника систем встановлення анафори, а з другого боку, проливають світло на прикладні аспекти інтерпретації займенників.
Уже відомо, що обмеження синтаксичної коіндексації має вирішальне значення для практичних підходів до розв’язання анафори. Оскільки, зокрема через синтакстичну неоднозначність, припущення про існування однозначного тлумачення синтаксису виявилося нереалістичним, у робастному розв’язанні анафори використовуються методи подолання цього недоліку.
У статті описано алгоритм ROSANA, який узагальнює перевірку обмежень коіндексації, щоб застосувати її до недосконалих синтаксичних описів, створених робастним новітнім парсером. За допомогою формальної оцінки на двох корпусах текстів різних жанрів і тематики показано, що ROSANA забезпечує ефективне робастне встановлення кореферентності. Крім того, за допомогою поглибленого аналізу доведено, що робастне впровадження заборони на кореферентність є майже оптимальним. Проведене дослідження свідчить, що у порівнянні з підходами на основі поверхневої попередньої обробки переважно нееврістична алгоритмізація заборони на кореферентність відкриває можливості для деякого поліпшення результатів. Більше того, показано що більш значного поліпшення результатів слід очікувати на інших ланках, особливо завдяки урахуванню жанру текстів при виборі стратегій ранжування.
Дослідження ефективності системи ROSANA значною мірою спирається на удосконалену методику оцінювання систем встановлення кореферентності, розробка якої є другим важливим доробком автора. На додаток до теоретико-модельної системи оцінювання, розробленої для оцінювання на конференції з розуміння повідомлень, визначено додаткові показники оцінювання, які, з одного боку, підтримують розробника систем встановлення анафори, а з другого боку, проливають світло на прикладні аспекти інтерпретації займенників.
Переклад В. Коломієць
Tetreault, R. J. A Corpus-Based Evaluation of Centering and Pronoun Resolution [Корпусно-базоване оцінювання центрування і встановлення референції займенників] / Joel R. Tetreault // Computational linguistics. – 2001. – Vol. 27. – No. 4. – Pages 507–520. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342644#.WIPBSX3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342644
У статті порівнюються алгоритми встановлення референції займенників і описується алгоритм центрування (центрування зліва направо), в основу якого покладено обмеження і правила теорії центрування і який є альтернативою алгоритму Бренанна, Фрідмана і Поларда (1987). Цей алгоритм центрування зліва направо було використано для того, щоб перевірити чи дійсно дві психолінгвістичні теорії ранжування Cf-списку поліпшують точність встановлення референції займенників. Результатом дослідження стала розробка нового ранжування Cf-списку на основі синтаксису і корпусно-базовані дані, що суперечать згаданим психолінгвістичним теоріям.
У статті порівнюються алгоритми встановлення референції займенників і описується алгоритм центрування (центрування зліва направо), в основу якого покладено обмеження і правила теорії центрування і який є альтернативою алгоритму Бренанна, Фрідмана і Поларда (1987). Цей алгоритм центрування зліва направо було використано для того, щоб перевірити чи дійсно дві психолінгвістичні теорії ранжування Cf-списку поліпшують точність встановлення референції займенників. Результатом дослідження стала розробка нового ранжування Cf-списку на основі синтаксису і корпусно-базовані дані, що суперечать згаданим психолінгвістичним теоріям.
Переклад В. Туз, М. Погребної
Meng Soon, W. A Machine Learning Approach to Coreference Resolution of Noun Phrases [Встановлення кореферентності іменних груп на основі машинного навчання] / Wee Meng Soon, Hwee Tou Ng, Daniel Chung Yong Lim // Computational linguistics. – 2001. – Vol. 27. – No. 4. – Pages 521–544. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342653#.WIPBS33sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342653
У статті описано підхід на основі машинного навчання до встановлення кореферентності іменних груп у необмеженому тексті. Модель навчається на невеликому за обсягом анотованому корпусі і встановлює кореферентність не лише певного типу іменних груп (наприклад, займенників), а радше загальних іменних груп. Вона також не накладає обмежень на типи іменних груп за значенням; тобто кореферентність встановлюється незалежно від типу іменної групи («організація», «особа» тощо). Модель тестувалась на загальних наборах даних (а саме, корпусах з розміткою кореферентності MUC-6 і MUC-7), отримано обнадійливі результати, які свідчать, що підхід на основі машинного навчання є перспективним для встановленнння кореферентності загальних іменних груп і за точністю є рівноцінним підходам без машинного навчання. Наша система є першою системою на основі машинного навчання, аналогічною найкращим сучасним системам, у яких не використовується машинне навчання, за ефективністю на цих наборах даних.
У статті описано підхід на основі машинного навчання до встановлення кореферентності іменних груп у необмеженому тексті. Модель навчається на невеликому за обсягом анотованому корпусі і встановлює кореферентність не лише певного типу іменних груп (наприклад, займенників), а радше загальних іменних груп. Вона також не накладає обмежень на типи іменних груп за значенням; тобто кореферентність встановлюється незалежно від типу іменної групи («організація», «особа» тощо). Модель тестувалась на загальних наборах даних (а саме, корпусах з розміткою кореферентності MUC-6 і MUC-7), отримано обнадійливі результати, які свідчать, що підхід на основі машинного навчання є перспективним для встановленнння кореферентності загальних іменних груп і за точністю є рівноцінним підходам без машинного навчання. Наша система є першою системою на основі машинного навчання, аналогічною найкращим сучасним системам, у яких не використовується машинне навчання, за ефективністю на цих наборах даних.
Переклад В. Туз, М. Погребної
Palomar, M. An Algorithm for Anaphora Resolution in Spanish Texts [Алгоритм розв’язання анафори у текстах іспанською мовою] / Manuel Palomar, Antonio Ferrández, Lidia Moreno, Patricio Martínez-Barco, Jesús Peral, Maximiliano Saiz-Noeda, Rafael Muñoz // Computational linguistics. – 2001. – Vol. 27. – No. 4. – Pages 545–567. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342662#.WIPDrX3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342662
У статті представлено алгоритм розпізнавання іменних груп, які виступають у ролі антецедентів особових займенників третьої особи, вказівних, зворотних та пропущених (нульових) займенників у необмежених текстах іспанською мовою. Визначено список обмежень та преференцій для різних типів займенникових виразів, а також детально задокументувано важливість кожного виду знань (лексичних, морфологічних, синтаксичних та статистичних) для розв’язання анафори у іспанській мові. У статті наведено визначення синтаксичних умов відсутності кореферентності типу іменна група-займенник у іспанській мові з використанням часткового синтаксичного аналізу. Алгоритм оцінювався на корпусі, який містить 1,677 займенників, було досягнуто коефіцієнт успішності 76,8%. Також було використано чотири конкуруючі алгоритми, ефективність яких була перевірена за допомогою оцінки наосліп на тому ж тестовому корпусі. Цей новий підхід можна легко застосувати для інших мов, таких як англійська, португальська, італійська чи японська.
У статті представлено алгоритм розпізнавання іменних груп, які виступають у ролі антецедентів особових займенників третьої особи, вказівних, зворотних та пропущених (нульових) займенників у необмежених текстах іспанською мовою. Визначено список обмежень та преференцій для різних типів займенникових виразів, а також детально задокументувано важливість кожного виду знань (лексичних, морфологічних, синтаксичних та статистичних) для розв’язання анафори у іспанській мові. У статті наведено визначення синтаксичних умов відсутності кореферентності типу іменна група-займенник у іспанській мові з використанням часткового синтаксичного аналізу. Алгоритм оцінювався на корпусі, який містить 1,677 займенників, було досягнуто коефіцієнт успішності 76,8%. Також було використано чотири конкуруючі алгоритми, ефективність яких була перевірена за допомогою оцінки наосліп на тому ж тестовому корпусі. Цей новий підхід можна легко застосувати для інших мов, таких як англійська, португальська, італійська чи японська.
Переклад В. Туз, М. Погребної
Byron, D. K. The Uncommon Denominator: A Proposal for Consistent Reporting of Pronoun Resolution Results [Відсутність єдиного підходу: пропозиція узгодити звітність про результати встановлення референції займенників] / Donna K. Byron // Computational linguistics. – 2001. – Vol. 27. – No. 4 – Pages 569–577. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120101753342671#.WIPDwH3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120101753342671
При встановленні референції займенників дослідники непослідовно обчислюють коефіцієнт успішності й не надають повного опису результатів. Пропонується нова норма складання звітності, яка підвищує якість представлення окремих результатів і збільшує шанси читачів порівняти методи, використані у різних дослідженнях. Також запропоновано поряд із точністю і повнотою використовувати нову інформативну метрику ефективності – відсоток розв’язання.
При встановленні референції займенників дослідники непослідовно обчислюють коефіцієнт успішності й не надають повного опису результатів. Пропонується нова норма складання звітності, яка підвищує якість представлення окремих результатів і збільшує шанси читачів порівняти методи, використані у різних дослідженнях. Також запропоновано поряд із точністю і повнотою використовувати нову інформативну метрику ефективності – відсоток розв’язання.
Переклад В. Туз, М. Погребної
Branco, A. Binding Machines [Автоматичне зв'язування] / António Branco // Computational linguistics. – 2002. – Vol. 28. – No. 1. – Pages 1–18. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120102317341747#.WIPFE33sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120102317341747
Зв'язуючі обмеження утворюють один з найбільш робастних модулів граматичних знань. Незважаючи на свою крослінгвістичну універсальність і практичну значимість для розв'язання анафори, вони опиралися повній інтеграції у автоматичний граматичний аналіз. Основною причиною цього є вихідний принцип всебічної коіндексації для їх специфікації і верифікації. В якості альтернативи пропонується підхід, який дозволяє специфікацію зв'язуючих обмежень на основі уніфікації, але передбачає методологію верифікації, яка допомагає позбутися існуючих недоліків. Цей альтернативний підхід базується на уявленні про те, що анафоричні імена можна уважати біндерами.
Зв'язуючі обмеження утворюють один з найбільш робастних модулів граматичних знань. Незважаючи на свою крослінгвістичну універсальність і практичну значимість для розв'язання анафори, вони опиралися повній інтеграції у автоматичний граматичний аналіз. Основною причиною цього є вихідний принцип всебічної коіндексації для їх специфікації і верифікації. В якості альтернативи пропонується підхід, який дозволяє специфікацію зв'язуючих обмежень на основі уніфікації, але передбачає методологію верифікації, яка допомагає позбутися існуючих недоліків. Цей альтернативний підхід базується на уявленні про те, що анафоричні імена можна уважати біндерами.
Переклад В. Коломієць
Miltsakaki, E. Toward an Aposynthesis of Topic Continuity and Intrasentential Anaphora [Про апосинтез* тематичної цілісності і міжреченнєву анафору] / Eleni Miltsakaki // Computational linguistics. – 2002. – Vol. 28. – No. 3. – Pages 319–355. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120102760276009#.WIPO8H3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120102760276009
Проблема підбору референтів для анафоричних виразів аналізувалась у великій кількості літературних джерел і за допомогою різноманітних підходів були досягнуті вагомі результати. Проте жодна окрема модель не може упоратися з усіма випадками. Ми уважаємо, що це спричинене неспроможністю моделей розрізнити два окремі процеси. На основі теоретичних висновків та емпіричних даних з різних мов пропонується апосинтетична* модель дискурсу, де тематична цілісність, обчислена для всіх одиниць, і притаманні цим одиницям пріоритети фокусування знаходяться під дією різних механізмів. Виявлені для всіх одиниць (тобто у різних реченнях) пріоритети фокусування найкраще моделювати за допомогою структурного методу згідно з теорією центрування. Механізм фокусування всередині одиниці, як стверджується у працях із семантичного/прагматичного фокусування, керується пріоритетами, спроектованими семантикою дієслів і сполучних слів, які містить одиниця. Показано, що таке розмежування не тільки вирішило важливі проблеми розв’язання анафори, але й зблизило суперечливі, на перший погляд, результати, представлені в літературі. Детально описано модель вирішення анафори, що чергує ці два механізми. Основні гіпотези запропонованої моделі перевірено у експериментальному дослідженні з англійської мови та корпусно-базованому дослідженні з грецької мови.
*Апосинтез – це грецьке слово, яке означає “декомпозиція”, тобто виокремлення компонентів того, що виглядає єдиним цілим.
Проблема підбору референтів для анафоричних виразів аналізувалась у великій кількості літературних джерел і за допомогою різноманітних підходів були досягнуті вагомі результати. Проте жодна окрема модель не може упоратися з усіма випадками. Ми уважаємо, що це спричинене неспроможністю моделей розрізнити два окремі процеси. На основі теоретичних висновків та емпіричних даних з різних мов пропонується апосинтетична* модель дискурсу, де тематична цілісність, обчислена для всіх одиниць, і притаманні цим одиницям пріоритети фокусування знаходяться під дією різних механізмів. Виявлені для всіх одиниць (тобто у різних реченнях) пріоритети фокусування найкраще моделювати за допомогою структурного методу згідно з теорією центрування. Механізм фокусування всередині одиниці, як стверджується у працях із семантичного/прагматичного фокусування, керується пріоритетами, спроектованими семантикою дієслів і сполучних слів, які містить одиниця. Показано, що таке розмежування не тільки вирішило важливі проблеми розв’язання анафори, але й зблизило суперечливі, на перший погляд, результати, представлені в літературі. Детально описано модель вирішення анафори, що чергує ці два механізми. Основні гіпотези запропонованої моделі перевірено у експериментальному дослідженні з англійської мови та корпусно-базованому дослідженні з грецької мови.
*Апосинтез – це грецьке слово, яке означає “декомпозиція”, тобто виокремлення компонентів того, що виглядає єдиним цілим.
Переклад В. Туз, М. Погребної
Bos, J. Implementing the Binding and Accommodation Theory for Anaphora Resolution and Presupposition Projection [Використання теорії прив’язування і пристосування для розв’язання анафори і проекції пресупозиції] / Johan Bos // Computational linguistics. – 2003. – Vol. 29. – No. 2. – Pages 179–210. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120103322145306#.WIPPrn3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120103322145306
У статті розглядаються обчислювальні аспекти запропонованої Ван дер Сандтом теорії прив’язування і пристосування (binding and accommodation theory, скор. BAT) для проекції пресупозицій і розв’язання анафори. BAT переформульована відповідно до вимог комп’ютерного впровадження, яке передбачає операції зі структурами репрезентації дискурсу (переіменування і злиття), репрезентацію пресупозицій (можливість вибіркового зв’язування і визначення вільних і зв’язаних змінних) і формулювання обмежень прийнятності, накладених BAT. Описано ефективний алгоритм розв’язання пресупозицій, представлені й інтегровані у вказаний алгоритм кілька подальших удосконалень, таких як першість у прив’язуванні і пристосуванні. Нарешті, проаналізовано інноваційне застосування високоточних програм для доведення теорем для контролю узгодженості репрезентацій дискурсу.
У статті розглядаються обчислювальні аспекти запропонованої Ван дер Сандтом теорії прив’язування і пристосування (binding and accommodation theory, скор. BAT) для проекції пресупозицій і розв’язання анафори. BAT переформульована відповідно до вимог комп’ютерного впровадження, яке передбачає операції зі структурами репрезентації дискурсу (переіменування і злиття), репрезентацію пресупозицій (можливість вибіркового зв’язування і визначення вільних і зв’язаних змінних) і формулювання обмежень прийнятності, накладених BAT. Описано ефективний алгоритм розв’язання пресупозицій, представлені й інтегровані у вказаний алгоритм кілька подальших удосконалень, таких як першість у прив’язуванні і пристосуванні. Нарешті, проаналізовано інноваційне застосування високоточних програм для доведення теорем для контролю узгодженості репрезентацій дискурсу.
Переклад В. Коломієць
Markert, K. Comparing Knowledge Sources for Nominal Anaphora Resolution [Порівняння джерел знань для розв’язання іменної анафори] / Katja Markert, Malvina Nissim // Computational linguistics. – 2005. – Vol. 31. – No. 3. – Pages 367–402. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/089120105774321064#.WIPQ9n3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/089120105774321064
Порівнюються два шляхи отримання лексичної інформації для вибору антецедента у порівняльній анафорі та кореферентності означених іменникових груп. Зокрема, порівнюються алгоритм, який спирається на посилання, закодовані у створеній вручну лексичній ієрархії WordNet, і алгоритм, що видобуває знання з корпусів за допомогою спрощених лексико-семантичних моделей. В якості корпусів використано Британський Національний Корпус (БНК), а також Інтернет, який раніше для цього завдання не використовувався. Отримані результати свідчать, що (а) знань, закодованих у WordNet, часто недостатньо, особливо для анафоричних відношень, які використовують суб’єктивні або асоціативні знання; (б) у розв’язанні порівняльної анафори алгоритм на основі Інтернету перевершує алгоритм на основі WordNet; (в) у розв’язанні кореферентності означених іменникових груп алгоритм на основі Інтернету дає такі самі результати, як і алгоритм на основі WordNet, при використанні всього корпусу, але перевершує алгоритм на основі WordNet при використанні підкорпусів; (г) в обох дослідженнях алгоритм на основі БНК виявився менш ефективним через розрідженість даних. Отже у проведених дослідженнях алгоритм на основі Інтернету частково компенсував відсутність лексичних знань, яка часто дається взнаки у розв’язанні анафори, і впорався з прикладами з контекстно-залежними анафоричними відношеннями. Завдяки своїй дешевизні і відсутності потреби у ручному моделюванні лексичних знань, він є перспективним джерелом знань для інтеграції в системи розв’язання анафори.
Порівнюються два шляхи отримання лексичної інформації для вибору антецедента у порівняльній анафорі та кореферентності означених іменникових груп. Зокрема, порівнюються алгоритм, який спирається на посилання, закодовані у створеній вручну лексичній ієрархії WordNet, і алгоритм, що видобуває знання з корпусів за допомогою спрощених лексико-семантичних моделей. В якості корпусів використано Британський Національний Корпус (БНК), а також Інтернет, який раніше для цього завдання не використовувався. Отримані результати свідчать, що (а) знань, закодованих у WordNet, часто недостатньо, особливо для анафоричних відношень, які використовують суб’єктивні або асоціативні знання; (б) у розв’язанні порівняльної анафори алгоритм на основі Інтернету перевершує алгоритм на основі WordNet; (в) у розв’язанні кореферентності означених іменникових груп алгоритм на основі Інтернету дає такі самі результати, як і алгоритм на основі WordNet, при використанні всього корпусу, але перевершує алгоритм на основі WordNet при використанні підкорпусів; (г) в обох дослідженнях алгоритм на основі БНК виявився менш ефективним через розрідженість даних. Отже у проведених дослідженнях алгоритм на основі Інтернету частково компенсував відсутність лексичних знань, яка часто дається взнаки у розв’язанні анафори, і впорався з прикладами з контекстно-залежними анафоричними відношеннями. Завдяки своїй дешевизні і відсутності потреби у ручному моделюванні лексичних знань, він є перспективним джерелом знань для інтеграції в системи розв’язання анафори.
Переклад А. Синящик
Yang, X. A Twin-Candidate Model for Learning-Based Anaphora Resolution [Метод розв’язання анафори з використанням машинного навчання з одним кандидатом] / Xiaofeng Yang, Jian Su, Chew Lim Tan // Computational linguistics. – 2008. – Vol. 34. – No. 3. – Pages 327–356. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/coli.2008.07-004-R2-06-57#.WIPT133sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/coli.2008.07-004-R2-06-57
Традиційний метод розв’язання анафори з використанням машинного навчання з одним кандидатом розглядає потенційні антецеденти анафора ізольовано і тому не може точно ранжувати потенційні антецеденти для навчання і розв’язання анафори. Для вирішення даної проблеми пропонується метод розв’язання анафори з двома кандидатами. Головна ідея, покладена в основу методу, полягає у перетворенні проблеми розв’язання анафори у проблему ранжування. Конкретніше, модель вибудовує класифікатор, який ранжує потенційні антецеденти і під час розв’язання вибирає антецедент певного анафора, виходячи із ранжування кандидатів. У статті представлено детальний опис методу розв’язання анафори з двома кандидатами. Крім того, розглянуто способи використання методу у складнішому завданні встановлення кореференції. Здійснено оцінювання методу з двома кандидатами за допомогою наборів даних для автоматичного видобування змісту. Результати експерименту свідчать, що запропонований метод із двома кандидатами є ефективнішим, ніж метод із одним кандидатом, у розв’язанні займенникової анафори. Він також однаково ефективно або ефективніше справляється із встановленням кореференції.
Традиційний метод розв’язання анафори з використанням машинного навчання з одним кандидатом розглядає потенційні антецеденти анафора ізольовано і тому не може точно ранжувати потенційні антецеденти для навчання і розв’язання анафори. Для вирішення даної проблеми пропонується метод розв’язання анафори з двома кандидатами. Головна ідея, покладена в основу методу, полягає у перетворенні проблеми розв’язання анафори у проблему ранжування. Конкретніше, модель вибудовує класифікатор, який ранжує потенційні антецеденти і під час розв’язання вибирає антецедент певного анафора, виходячи із ранжування кандидатів. У статті представлено детальний опис методу розв’язання анафори з двома кандидатами. Крім того, розглянуто способи використання методу у складнішому завданні встановлення кореференції. Здійснено оцінювання методу з двома кандидатами за допомогою наборів даних для автоматичного видобування змісту. Результати експерименту свідчать, що запропонований метод із двома кандидатами є ефективнішим, ніж метод із одним кандидатом, у розв’язанні займенникової анафори. Він також однаково ефективно або ефективніше справляється із встановленням кореференції.
Переклад В. Коломієць
Recasens, M. On Paraphrase and Coreference [Про перифраз і кореференцію] / Marta Recasens, Marta Vila // Computational linguistics. – 2010. – Vol. 36. – No. 4. – Pages 639–647. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/coli_a_00014#.WIPUUX3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/coli_a_00014
Завдяки забезпеченню кращого розуміння перифрази і кореференції з точки зору схожості і розбіжностей у їх лінгвістичній природі у статті уточнюються цілі видобування перифраз і встановлення кореференції і наскільки вони можуть допомогти одне одному. Стверджується, що це обговорення має безпосереднє відношення до обробки природної мови.
Завдяки забезпеченню кращого розуміння перифрази і кореференції з точки зору схожості і розбіжностей у їх лінгвістичній природі у статті уточнюються цілі видобування перифраз і встановлення кореференції і наскільки вони можуть допомогти одне одному. Стверджується, що це обговорення має безпосереднє відношення до обробки природної мови.
Переклад В.Коломієць
Siddharthan, A. Information Status Distinctions and Referring Expressions: An Empirical Study of References to People in News Summaries [Ознаки статусу інформації і референційні вирази: емпіричне дослідження посилань на людей у зведеннях новин] / Advaith Siddharthan, Ani Nenkova, Kathleen McKeown // Computational linguistics. – 2011. – Vol. 37. – No. 4. – Pages 811–842. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/COLI_a_00077#.WIPUwH3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00077
Хоча існує багато теоретичних праць, присвячених використанню різних ознак статусу інформації для пояснення форм посилань у письмових текстах, досліджень, у яких здіснена спроба автоматично виявляти ці ознаки для генерування посилань у контексті автоматично відтвореного тексту, проведено недостатньо. У статті описано модель генерування посилань на людей у випусках новин, у якій використано ідеї як з теоретичних праць, так і з корпусного аналізу інформаційних випусків, написаних людьми. Зокрема, запропонована модель виявляє, як дві характеристики згаданої у випуску новин особи – чи відома вона читачеві і яка її загальна роль у випуску новин – впливають на зміст і форму першого посилання на ту особу в інформаційному випуску. Показано, що ці дві ознаки можна виявити у типовому введенні для багатодокументного реферування і що їх можна використати у процесі генерування для підвищення якості екстрактивних рефератів.
Хоча існує багато теоретичних праць, присвячених використанню різних ознак статусу інформації для пояснення форм посилань у письмових текстах, досліджень, у яких здіснена спроба автоматично виявляти ці ознаки для генерування посилань у контексті автоматично відтвореного тексту, проведено недостатньо. У статті описано модель генерування посилань на людей у випусках новин, у якій використано ідеї як з теоретичних праць, так і з корпусного аналізу інформаційних випусків, написаних людьми. Зокрема, запропонована модель виявляє, як дві характеристики згаданої у випуску новин особи – чи відома вона читачеві і яка її загальна роль у випуску новин – впливають на зміст і форму першого посилання на ту особу в інформаційному випуску. Показано, що ці дві ознаки можна виявити у типовому введенні для багатодокументного реферування і що їх можна використати у процесі генерування для підвищення якості екстрактивних рефератів.
Переклад В. Коломієць
Sapena, E. A Constraint-Based Hypergraph Partitioning Approach to Coreference Resolution [Метод встановлення кореференції шляхом розбиття гіперграфів на основі обмежень] / Emili Sapena, Lluís Padró, Jordi Turmo // Computational linguistics. – 2013. – Vol. 39. – No. 4. – Pages 847–884. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/COLI_a_00151#.WIPVrn3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00151
Стаття присвячена дослідженню машинного навчання для встановлення кореференції. Встановлення кореференції — це завдання обробки природньої мови, яке полягає у визначенні виразів у дискурсі, які відносяться до одного об’єкта.
Головними положеннями цієї статті є 1) новий підхід до встановлення кореференції на основі дотримання обмежень, у якому проблема представлена у вигляді гіперграфа і вирішується шляхом розмитої розмітки і 2) дослідження підвищення результативності встановлення кореференції шляхом використання знань про світ, отриманих з Вікіпедії.
Розроблений метод може з більшою виразністю, ніж методи на основі пар, використовувати модель класифікації згадувань об’єктів і долати слабкі місця попередніх підходів у сучасних системах, такі як зв’язування суперечностей, класифікації без контексту і оцінювання пар за нестачі інформації. Крім того, запропонований метод дозволяє вбудовувати нову інформацію шляхом додавання обмежень. Також здійснено дослідження для того, щоб використовувати знання про світ з метою підвищенння результативності.
Програма RelaxCor, яка є втіленням запропонованого підходу, за результативністю не поступається сучасним системам і брала участь у міжнародних змаганнях SemEval-2010 і CoNLL-2011. RelaxCor зайняла друге місце у змаганні CoNLL-2011.
Стаття присвячена дослідженню машинного навчання для встановлення кореференції. Встановлення кореференції — це завдання обробки природньої мови, яке полягає у визначенні виразів у дискурсі, які відносяться до одного об’єкта.
Головними положеннями цієї статті є 1) новий підхід до встановлення кореференції на основі дотримання обмежень, у якому проблема представлена у вигляді гіперграфа і вирішується шляхом розмитої розмітки і 2) дослідження підвищення результативності встановлення кореференції шляхом використання знань про світ, отриманих з Вікіпедії.
Розроблений метод може з більшою виразністю, ніж методи на основі пар, використовувати модель класифікації згадувань об’єктів і долати слабкі місця попередніх підходів у сучасних системах, такі як зв’язування суперечностей, класифікації без контексту і оцінювання пар за нестачі інформації. Крім того, запропонований метод дозволяє вбудовувати нову інформацію шляхом додавання обмежень. Також здійснено дослідження для того, щоб використовувати знання про світ з метою підвищенння результативності.
Програма RelaxCor, яка є втіленням запропонованого підходу, за результативністю не поступається сучасним системам і брала участь у міжнародних змаганнях SemEval-2010 і CoNLL-2011. RelaxCor зайняла друге місце у змаганні CoNLL-2011.
Переклад М. Драчової і К. Погорєлова
Lee, H. Deterministic Coreference Resolution Based on Entity-Centric, Precision-Ranked Rules [Детерміністичний підхід до встановлення кореференції на основі об’єктно-орієнтованих, ранжованих за точністю правил] / Heeyoung Lee, Angel Chang, Yves Peirsman, Nathanael Chambers, Mihai Surdeanu, Dan Jurafsky // Computational linguistics. – 2013. – Vol. 39. – No. 4. – Pages 885–916. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/COLI_a_00152#.WIRq333sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00152
У статті описано новий детерміністичний підхід до встановлення кореференції, який поєднує загальну інформацію і конкретні характеристики сучасних моделей на основі машинного навчання з прозорістю і модульним принципом організації детерміністичних систем на основі правил. Наша архітектура фільтрації по черзі застосовує комплекс детерміністичних моделей кореференції від найвищої до найнижчої точності, у якому кожна модель базується на результатах кластера попередньої моделі. Два рівні розробленої архітектури фільтрації: рівень визначення згадування, орієнтований переважно на повноту, за яким слідують фільтри референції, орієнтовані на точність – це надійний спосіб досягнення як високої точності, так і високої повноти. Крім того, у запропонованому підході використовується глобальна інформація за допомогою об’єктно-орієнтованої моделі, яка сприяє уніфікації характеристик усіх згадувань того самого реального об’єкта. Незважаючи на свою простоту, запропонований метод дозволив досягти конкурентноспроможних результатів на кількох корпусах і жанрах і був вбудований у сучасні гібридні системи встановлення кореференції для китайської і арабської мов. Отже, у розробленій системі втілена нова парадигма об’єднання знань у системах на основі правил, яка матиме наслідки для комп’ютерної лінгвістики загалом.
У статті описано новий детерміністичний підхід до встановлення кореференції, який поєднує загальну інформацію і конкретні характеристики сучасних моделей на основі машинного навчання з прозорістю і модульним принципом організації детерміністичних систем на основі правил. Наша архітектура фільтрації по черзі застосовує комплекс детерміністичних моделей кореференції від найвищої до найнижчої точності, у якому кожна модель базується на результатах кластера попередньої моделі. Два рівні розробленої архітектури фільтрації: рівень визначення згадування, орієнтований переважно на повноту, за яким слідують фільтри референції, орієнтовані на точність – це надійний спосіб досягнення як високої точності, так і високої повноти. Крім того, у запропонованому підході використовується глобальна інформація за допомогою об’єктно-орієнтованої моделі, яка сприяє уніфікації характеристик усіх згадувань того самого реального об’єкта. Незважаючи на свою простоту, запропонований метод дозволив досягти конкурентноспроможних результатів на кількох корпусах і жанрах і був вбудований у сучасні гібридні системи встановлення кореференції для китайської і арабської мов. Отже, у розробленій системі втілена нова парадигма об’єднання знань у системах на основі правил, яка матиме наслідки для комп’ютерної лінгвістики загалом.
Переклад В. Коломієць
Bejan, C. A. Unsupervised Event Coreference Resolution [Неконтрольоване виявлення кореферентних номінацій події] / Cosmin Adrian Bejan, Sanda Harabagiu // Computational linguistics. – 2014. – Vol. 40. – No. 2. – Pages 311–347. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/COLI_a_00174#.WIRpyH3sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00174
Завдання виявлення кореферентних номінацій події відіграє ключову роль у багатьох системах обробки природної мови, таких як видобування інформації, питання-відповідь, визначення і контроль тематики. У статті описано новий класс неконтрольованих, непараметричних байесовських моделей для вірогіднісного визначення кореферентних сукупностей номінацій події у наборі нерозмічених документів. Для визначення цих сукупностей із набору документів автоматично видобуваються лексичні, синтаксичні і семантичні характеристики кожної номінації події. Створення великого набору характеристик кожної номінації події дозволяє розглядати завдання виявлення кореферентних номінацій події як завдання групування номінацій із однаковими характеристиками (вони мають одних і тих же учасників, відбуваються в одному й тому ж місці, в один і той же час тощо).
Деякі з найскладніших проблем неконтрольованого виявлення кореферентних номінацій події пов’язані з (а) вибором представлення номінацій події у вигляді великого набору характеристик і (б) можливістю моделювати події, описані в одному й тому ж і в багатьох документах. Наша перша некотрольована модель, яка вирішує ці проблеми, являє собою узагальнення ієрархічного процесу Діріхле. Це нове доповнення демонструє здатність ієрархічного процесу Діріхле виявляти невизначеність кількості компонентів сукупності і крім того враховує будь-яке кінечне число характеристик, які асоціюються з кожною номінацією події. Більше того, щоб подолати деякі обмеження цього доповнення, створена нова гібридна модель, яка об’єднує необмежену латентно-класову модель і модель для дискретних часових рядів. Головною перевагою цієї гібридної моделі є її здатність автоматично робити на основі даних висновок про кількість характеристик, які асоціюються із кожною номінацією події, і водночас автоматично відбирати найінформативніші характеристики для виявлення кореферентних номінацій події. Оцінка виявлення кореферентних номінацій події у одному і різних документах свідчить про значне удосконалення цих моделей у порівнянні з вихідними показниками для цього завдання.
Завдання виявлення кореферентних номінацій події відіграє ключову роль у багатьох системах обробки природної мови, таких як видобування інформації, питання-відповідь, визначення і контроль тематики. У статті описано новий класс неконтрольованих, непараметричних байесовських моделей для вірогіднісного визначення кореферентних сукупностей номінацій події у наборі нерозмічених документів. Для визначення цих сукупностей із набору документів автоматично видобуваються лексичні, синтаксичні і семантичні характеристики кожної номінації події. Створення великого набору характеристик кожної номінації події дозволяє розглядати завдання виявлення кореферентних номінацій події як завдання групування номінацій із однаковими характеристиками (вони мають одних і тих же учасників, відбуваються в одному й тому ж місці, в один і той же час тощо).
Деякі з найскладніших проблем неконтрольованого виявлення кореферентних номінацій події пов’язані з (а) вибором представлення номінацій події у вигляді великого набору характеристик і (б) можливістю моделювати події, описані в одному й тому ж і в багатьох документах. Наша перша некотрольована модель, яка вирішує ці проблеми, являє собою узагальнення ієрархічного процесу Діріхле. Це нове доповнення демонструє здатність ієрархічного процесу Діріхле виявляти невизначеність кількості компонентів сукупності і крім того враховує будь-яке кінечне число характеристик, які асоціюються з кожною номінацією події. Більше того, щоб подолати деякі обмеження цього доповнення, створена нова гібридна модель, яка об’єднує необмежену латентно-класову модель і модель для дискретних часових рядів. Головною перевагою цієї гібридної моделі є її здатність автоматично робити на основі даних висновок про кількість характеристик, які асоціюються із кожною номінацією події, і водночас автоматично відбирати найінформативніші характеристики для виявлення кореферентних номінацій події. Оцінка виявлення кореферентних номінацій події у одному і різних документах свідчить про значне удосконалення цих моделей у порівнянні з вихідними показниками для цього завдання.
Переклад В. Коломієць
Fernandes, E. R. Latent Trees for Coreference Resolution [Приховані дерева для встановлення кореференції] / Eraldo Rezende Fernandes, Cícero Nogueira dos Santos, Ruy Luiz Milidiú // Computational linguistics. – 2014. – Vol. 40. – No. 4. – Pages 801–835. – Режим доступу до анотації: http://www.mitpressjournals.org/doi/abs/10.1162/COLI_a_00200#.WIRpR33sSGA – Режим доступу до повнотекстової статті: http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00200
У статті описано систему структурного аналізу на основі машинного навчання для необмеженого встановлення кореференції, яка використовує дві ключові методики моделювання: приховані дерева кореференційних зв’язків і автоматичне виведення ознак на основі ентропії. Моделювання на основі прихованих дерев уможливлює комп’ютерне навчання, бо включає інформативну приховану структуру. Крім того, користуючись методом автоматичного виведення ознак, можна ефективно створювати удосконалені нелінійні моделі за допомогою автоматичних алгоритмів лінійних моделей. У статті наведено емпіричні результати, які висвітлюють роль кожного методу моделювання, використаного у розробленій системі. Емпірична оцінка зійснювалась за допомогою багатомовних необмежених баз даних для змагань у рамках конференції CoNLL-2012, які охоплюють три мови: арабську, китайську і англійську. До усіх мов застосовувалась одна й та ж система за винятком незначних адаптацій до специфічних характеристик мови, таких як вкладені посилання і спеціальні статичні списки займенників. Попередня версія цієї системи була представлена на закритих змаганнях конференції CoNLL-2012 і стала найкращою серед конкурсантів із офіційним результатом 58,69. Єдиним удосконаленням останньої версії системи є додавання можливих дуг, які зв’язують вкладені посилання для китайської мови. Завдяки додаванню таких дуг показники для цієї мови зросли майже на 4,5 пункти. Результат існуючої системи становить 60,15 і відповідає зменшенню кількості помилок на 3,5%. Це найрезультативніша система для кожної з трьох мов.
У статті описано систему структурного аналізу на основі машинного навчання для необмеженого встановлення кореференції, яка використовує дві ключові методики моделювання: приховані дерева кореференційних зв’язків і автоматичне виведення ознак на основі ентропії. Моделювання на основі прихованих дерев уможливлює комп’ютерне навчання, бо включає інформативну приховану структуру. Крім того, користуючись методом автоматичного виведення ознак, можна ефективно створювати удосконалені нелінійні моделі за допомогою автоматичних алгоритмів лінійних моделей. У статті наведено емпіричні результати, які висвітлюють роль кожного методу моделювання, використаного у розробленій системі. Емпірична оцінка зійснювалась за допомогою багатомовних необмежених баз даних для змагань у рамках конференції CoNLL-2012, які охоплюють три мови: арабську, китайську і англійську. До усіх мов застосовувалась одна й та ж система за винятком незначних адаптацій до специфічних характеристик мови, таких як вкладені посилання і спеціальні статичні списки займенників. Попередня версія цієї системи була представлена на закритих змаганнях конференції CoNLL-2012 і стала найкращою серед конкурсантів із офіційним результатом 58,69. Єдиним удосконаленням останньої версії системи є додавання можливих дуг, які зв’язують вкладені посилання для китайської мови. Завдяки додаванню таких дуг показники для цієї мови зросли майже на 4,5 пункти. Результат існуючої системи становить 60,15 і відповідає зменшенню кількості помилок на 3,5%. Це найрезультативніша система для кожної з трьох мов.
Переклад В. Коломієць