Однако надо отдать проге должное:
jobs a good'un - джобс эй гуд'ан
|
||
Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы | ||
|
||
Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы | ||
Модераторы: Dragan, Valer'janka
Klyshinsky писал(а):Интересно как он сам себя именовал?
Klyshinsky писал(а):Мы работаем над этой проблемой. Осталось два принятых сейчас. Чур город в Каролине пока добавлять не буду.
Klyshinsky писал(а):Про
Tremblay-en-France => Трэмбле-эн-Франс
Jean-Loup Fiévet => Жан-Луп Фьеве
Seine-Saint-Denis => Сен-Сэн-Дени
Hervé Ghesquière => Эрв Гескье
С последним всё понятно - веб-интерфейс откусывает диакритики (камень про бета-версию принят в открытую грудь, лечу к земле теряя перья). Остальные три не могли бы Вы откомментировать?
Klyshinsky писал(а):составлял сам себе базу оригинал-перевод, писал правила, смотрел где не сходится, вносил исправления.
Murena писал(а):Jean-Loup Fiévet => Жан-Лу Фьеве (финальная буква "р" тут не читается).
Seine-Saint-Denis => Сена-Сен-Дени (название департамента, составная его часть - название реки Сена (традиционный в русском вариант). Кроме того, "э" в русской графике при передаче французских имен собственных принято ставить только в начале слова или после иной гласной.
Murena писал(а):Tremblay-en-France - Трамбле-ан-Франс (а обоих случаях тут носовой звук "а", и непонятно, почему в вашей программе иначе.
Ну, а ситуация с Hervé Ghesquière вообще проблемна, даже если проблему с диакритикой в вашей программе оставим за скобками. Это может быть как Эрве Гескьер, так и Эрве Гекьер (и выяснить подобное можно только у самого носителя фамилии).
Клон Голландца писал(а):
1. То, что вы описали, - не тестирование, а процесс обучения алгоритма. Для обучающей (т. е. "идеальной") выборки, по которой подбираются значения параметров алгоритма в процессе обучения, функция ошибки и должна принимать минимальные значения. Но и на этом этапе уже есть сомнения по поводу корректности. Процесс формирования обучающей выборки и процесс подгонки параметров должны быть разделены, а у вас ими заведовал один и тот же человек, который формировал эту выборку неизвестно по каким критериям.
2. После обучения алгоритма должна быть сформирована представительная контрольная прогностическая выборка (правильно рандомизированная). Если ваш алгоритм транскрипции одинаково применим к именам собственным и обычной лексике, то такую контрольную выборку можно сформировать по любому двуязычному словарю. Ошибка, полученная в результате тестирования на данной выборке (и уже без подгонки параметров алгоритма), и будет показателем качества работы программы. Этого этапа в вашем описании я не увидел.
3. Теперь про транскрипцию уже существующих имен собственных. Вы ее для чего задумали: для того чтобы человек, приезжающий в столицу Франции мог правильно произнести ее название, не зная французского, или для того, чтобы он правильно мог его написать по-русски? Непонятно. В последнем случае алгоритмизация транскрипции уже существующих имен собственных – дело безнадежное. Это задача для базы данных. У вас она называется словарем исключений, но ее объем в 3000 слов (все языки? только английский?) вызовет недоумение у кого угодно. Посмотрите, например, словари английских имен и фамилий Рыбакина и отсканируйте пару атласов.
4. Судя по всяким «лукупам», «чайлдренам» и «чарисмам», у лингвистов вы свой алгоритм не тестировали. А как обстоит дело с рецензированием ваших статьей и книг специалистами по языку?
5. Ваша работа претендует на научность. Не следует ли сравнить работу своего алгоритма с работой других программ? Наверняка, ведь, есть: у Артемия Лебедева на сайте, например. Чем ваш алгоритм лучше?
Klyshinsky писал(а):Сразу хочу сказать, что базы клиента были уничтожены
Klyshinsky писал(а):В случае с эн - это было осознанное решение. Я четко понимаю, что здесь мы пошли против традиции, но задачей было создать восстанавливаемое имя. То есть чтобы по русскому написанию можно было сгенерировать что-то похожее на оригинал.
Klyshinsky писал(а): у меня было ощущение, что французы en и an произносят чуть по-разному, так?
Вернуться в Передача имен собственных
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4