ВСИЧКО ЗА КИТАЙ

中国大观园

от Яна Шишкова и приятели на Китай

януари 9, 2009

Към всички български китаисти предложение за създаване на електронен китайско-български речник от Камен Иванов

в категория Тематичен речник

Здравейте,
Благодаря на г-жа Шишкова за възможността да разкажа за моя проект!

Първо да се представя. Казвам се Камен Иванов. Още в далечното минало, когато Интернет тепърва навлизаше, бях сред хората, които бяха открили магията на чата. Всъщност, за мен тя беше във възможността човек лесно да намира подходящите събеседници за темите, които го интересуват. Помня, с добри чувства, онова време, но бързо осъзнах, че българското Интернет-пространство ми е тясно. Започнах да си търся интересни запознанства с хора от други страни. Така освен всичко друго, си допълвах и знанията по география, а и заниманията даваха усещане за приключение.

Случайно или не приятели от други европейски страни почти не можах да си намеря. (Имам си своето обяснение за това, но не му е мястото тук.). Най-много приятели си намерих от азиатските страни. Не съм предубеден, но опитът ми показа, че китайците са най-отворени за комуникация – винаги любопитни, заинтересовани, добродушни и позитивни… Естествено езиковата бариера съществуваше, но оптимизмът ми нарасна особено, след като направих няколко познанства с хора, които не знаят и дума английски и се обяснявах с тях само, и единствено чрез услугите на google translate. С експерименти установих, че ако се преведе английска фраза на китайски с google translate и след това полученото бъде обратно преведено, ако това което сте искали да кажете, и това, което сте получили като обратен превод съвпадат като смисъл – значи почти сигурно е, че преводът на китайски е сносен или поне разбираем за китаец. ( В противен случай можете да нагласявате английските думи до постигането на съответствие на обратния превод. )

В този ред на мисли, пропуснах да кажа, че съм завършил електроника ТУ-София и по времето, за което става дума работех във фирма за производство на електронни устройства. В свободното време все дискутирахме с мои колега какъв „проект-приключение“ да подхванем и общ извод беше, че устройство, което по някакъв начин обработва йероглифи би отговаряло на това изискване. По едно време дори бях намерил няколко китайски производители на електронни речници и напълно уверен във възможностите си щедро им бях предложил да им подам ръка. Въпреки наивността на идеята не съжалявам, защото беше забавно, а и от това излязоха нови интересни познанства.

Толкова за предисторията. Понастоящем щастливо изучавам китайски в институт „Конфуций“. Въпреки че съм оптимист, все още, най-добре се справям с писането на йероглифи с помощта на компютър и превеждането на китайски текстове с google translate. Идеята за електронен китайско-български/българо-китайски речник не ме е напуснала, а и пред вид, че освен услугите на google, други в тази ниша няма (или поне аз не знам), просто се чувствам призован да взема отношение по въпроса. Разбира се, вече съм помъдрял и вижданията ми за „електронен“ се свеждат не до устройство, а до речник, достъпен в Интернет.

Преди известно време започнах да работя над този проект. Адресът му е http://zhongbaotong.com . В момента в речника е заложена речникова база, съответстваща на „Большой китайско-русский словарь“. Създаването на тази база в цифров вид, доколкото знам руснаците са направили на доброволчески начала (повече за тяхната база-данни тук: http://lingvodics.com/dics/details/77 ).

Според мен, използването й ще улесни реализацията на българската версия, защото няма да се налага въвеждане на огромно количество йероглифи и pin yin на ръка. Въпреки значителния й обем в тази база липсват немалко термини и за тях ще трябва да се въвежда цялата информация.

Какви са вижданията ми за развитието на този речник?

1) Създаване на базата данни.

В момента, базата съдържа малко над 200 000 записа ( и то при положение, че липсват „елементарни“ думи като 女朋友 . Забелязъл съм, че в някои случаи преводът на едни и същи думи и изрази присъства два пъти – веднъж записът съдържа традиционни, и веднъж – опростени йероглифи. Все още нямам статистика каква част записи съвпадат по този начин. От друга страна има записи, които са с простичък и ясен кратък превод. Но доста от тях съдържат обяснения по страница и повече, където са представени различни значения, граматически пояснения, примери и др. При всички положения, очевидно е, че дори един човек да си посвети живота за целта, пак ще е в състояние да обработи едва малка част от всичко. Моята идея е, този речник освен да бъде редактиран от множество хора, а заниманията с него да бъдат приятни, и да не натоварват никого.

Ако приемем, че един специалист се занимава с речника без да се претоварва, просто „покрай другото“, би могъл да превежда средно по 1 термин на ден. За три години ще преведе около 1000 термина. Ако има 10 такива човека, за 3 години ще се съберат 10 000 термина, което е доста сериозен речников запас. Това са мои допускания и предполагам, че отговарят на „най-лошия случай“, защото нищо чудно, да има хора, които могат да превеждат и по повече от споменатото, а и нищо чудно да се намерят повече от 10 човека, които да са съгласни да се занимават. Според плановете ми, речникът ще има „панел за преводачи“. Всеки, изявил желание да се включи в проекта ще получи потребителско име и парола. Когато пожелае да добвави или редактира термин, ще може да се регистрира с тях в системата и да редактира желаните термини директно, онлайн чрез уеб-форма.

2) Полезност и възможности.

Редактираният от хора речник би следвало да е доста по-достоверен (сравнявано с google translate), особено що се касае до специализирана терминология. Отделно, фактът, че речникът ще е в електронен вид би могъл да даде възможност за реализация на редица интересни възможности. Развитието на речниковата базата и развитието на нови възможности на софтуера могат да се движат паралелно. Какви възможности би било полезно да се добавят тепърва ще се дискутира.

Тези, за които съм се сетил на първо време са:

– може да се поддържат различни признаци на всеки термин – приндлежността му като част на речта, в различни тематични и граматически групи. Въз основа на това могат да се генерират различни видове интересни справки – например колко често се среща даден йероглиф, даден ключ и др.

– в една по-развита бъдеща версия би могло да се реализира търсене по зададен ключ, по аналогия с хартиените речници.

– при търсене може да се задава търсене на даден термин само в определена тематична област.

– за всеки термин ще се пази информация от кого е бил редактиран. Всеки преводач ще има право над авторските права за превода на преведените от него термини. При това положение той ще има правото да „извлече“ преведеното от него и да го ползва както намери за добре, за лични цели – издаване на хартиени речници, продаване под някаква форма, и т.н.

– за някои йероглифи би могло да се поддържа допълнителна информация извън директния превод – като информация за произхода им, значението им в миналото, забележки за граматическата употреба, препратки към допълнителни източници и др.

– възможността за дискусия ще позволи прецизиране и подобряване на терминологията.

– може да се добавя специализирано съдържание – например поговорки, идиоматични изрази и др.

– всички идеи, които са свързани по някакъв начин с предимствата на автоматизираната обработка могат да бъдат приложени.

3) Относно евентуално финансиране на проекта.

Би могло да се събират приходи от реклами публикувани на сайта, дарения, направеното съдържание да се продава, издава и др., и спечеленото да се разпределя според заслугите между участниците в проекта. Може да се помисли и дали наличното съдържание да бъде изцяло отворено или при определени случаи да се събира такса за достъп. Освен това, както споменах по-горе, всеки ще има правото да се разпорежда както намери за добре със съдържанието, генерирано от него.

Докато се получи продукт, достоен за ползване, респ. за продаване, ще има достатъчно време да се помисли по тези въпроси и какво ще се направи ще зависи, и от мнението на тези, които участват. Все пак, основното, което трябва да се знае е, че този проект ще развивам основно за забавление и лично удовлетворение, а след това по всякакви други причини. Разчитам това да е така и с хората, които биха се включили за развитието му.

4) Начало

В момента се занимавам с развиването на софтуерната част. Смятам, че до около месец (например началото на февруари 2009) основната функционалност на речника ще е завършена. Това означава, че в началото на февруари всеки заинтересован да помага за развиване на съдържанието на базата данни ще може да получи потребителско име и парола, и да започне да редактира базата в сегашния й вид. Смятам, че е добре преди да е започнала работата заинтересованите да се обадят. Така може да се дискутират различни технически въпроси. Трябва да се знае, че съм доста далеч от проблемите на филолозите и някои „очевидни“ за тях неща за мен може да не са толкова очевидни. Затова е добре да има дискусия, да се дават предложения и да се получи удобна и полезна система. Достъп до базата ще получи всеки заявил интерес и възможности.
Предлагам мястото за бъдещи дискусии по темата да бъде в този форум http://www.cnbgbbs.com/bbs/viewthread.php?tid=11&extra=page%3D1 .

404

Creative Commons License
Публикациите, подписани от Яна Шишкова, ползват условията на Криейтив Комънс лиценз.
Всички останали принадлежат на техните автори!

krasota

Търсене:

Категории:

bodypaint

Навигация:

Учете китайски в 138-мо СОУ

Учи в Китай! Виж как.