Зеленым отмечены синонимы, присутствующие в словаре. Красным отмечены синонимы, отсутствующие в словаре.
Зеленым отмечены антонимы, присутствующие в словаре. Красным отмечены антонимы, отсутствующие в словаре.
Поскольку разметка корпуса выполняется вручную или почти вручную, а сами по себе корпуса довольно велики (речь идёт о сотнях тысяч словоупотреблений) то эти размеченные данные составляют существенную часть стоимости получающихся технологий.
Источник: 0151835
Наша ближайшая цель — создать корпус в 1 млн. словоупотреблений к концу 2011 года.
Источник: 0151835
На данный момент в корпус включено 150 тыс. словоупотреблений ( актуальная статистика всегда тут http://www.opencorpora.org/?page=stats ).
Источник: 0151835
Уже упомянутая Мона Бейкер (Центр переводоведческих и межкультурных исследований университета Манчестера) создала Translational English Corpus (TEC) — массив письменных текстов, переведённых на английский с различных языков, насчитывающий 10 миллионов словоупотреблений.
Источник: Корпус несовершенных переводов: необходимость проекта
Кроме того, объём в 1 миллион словоупотреблений, заявленный создателями этого корпуса, мы считаем недостаточным.
Источник: Корпус несовершенных переводов: необходимость проекта
Целевой объём корпуса установлен в 10 миллионов словоупотреблений, по аналогии с существующими параллельными и переводоведческими корпусами: соответствующим подкорпусом НКРЯ и The Translational English Corpus.
Источник: Корпус несовершенных переводов: необходимость проекта
1. Набор пилотного параллельного корпуса в 1 миллион словоупотреблений.
Источник: Корпус несовершенных переводов: необходимость проекта
5. Набор основного корпуса (до 10 миллионов словоупотреблений).
Источник: Корпус несовершенных переводов: необходимость проекта