domenica 24 gennaio 2016

IL MISTERO DI TRANSLATISH.COM

Per puro caso ho scoperto un sito di un estremo interesse:


Come ognuno può vedere esplorandolo, è scritto in una lingua del tutto sconosciuta. La sua homepage ha come titolo ERMIM CUBES PROGSEZ UNS CEUX BASTUA. Si vede subito che il sito ha una architettura abbastanza complessa, come se fosse un Wiki: ogni pagina contiene numerosi link ad altre pagine, tanto che non sembra esserci limite a un simile labirinto. Molte pagine sono descrittive e contengono lunghi testi completamente impenetrabili. Altre invece sono bilingui e riportano lunghi elenchi di frasi tradotte in inglese. 

Discussione in Facebook

Riporto una cronistoria dei miei tentativi di capirci qualcosa, tratta da post e commenti pubblicati su Facebook e da interventi di amici.

  I dati di fatto assodati sono pochi ma significativi. È possibile, per quanto non facile, capirci qualcosa. Sono partito da queste due frasi:

C: Rendie gardis bildart ver estar fafran.
E: Every appointments lawfully smile the false area.

C: Ti saidrem nieplu kering franfer viargu ciartai, fonleb min tourbil lin nugce mort nag dontoff.
E: Let's signal by the younger areas, but don't alter the old alleviations.

Questo sono riuscito ad estrarre:

FAFRAN = area 
FRANFER = areas.
 

A partire dalle traduzioni, si deducono anche le seguenti equivalenze: 

ESTAR = false
KERING = young
 

Evidentemente è una lingua introflessiva.

■  Sono giunto alla conclusione che nella lingua di Translatish.com la parola per dire "ebrei" compaia nelle seguenti varianti: VAN, WEEN e MEAN. Così "scozzesi" si dice SUPTI. Evidentemente i parlanti di questa lingua bizzarrissima hanno una gran cura nel designare ogni dettaglio di questo mondo con parole impenetrabili.

A quanto pare la parola inglese scelta per tradurre VAN, WEEN e MEAN è sempre Hebrew(s), mai Jew(s).

■  Comincio a delineare tratti di fonetica. Come ho subito capito, l'ortografia usata è quella inglese. Così avremo VAN /væn/, WEEN /wi:n/ e MEAN /mi:n/. La struttura della lingua richiama quella del gaelico, con alterazioni anche profonde delle consonanti iniziali dovute ad antichi suoni ormai scomparsi. 

    ► Pietro: "Se si trattasse di una neolingua creata ed utilizzata da malintenzionati per scambiare oscuri messaggi?"

È possibile. Ma è di una complessità allucinante. Si danno molti casi di uso di lingue criptiche da parte di criminali, ma in genere tendono a usare lingue già esistenti o a elaborare lingue furbesche (ad esempio lingue inverse). Ho letto che in Messico alcuni narcos usano il nahuatl per comunicare. Qui però sembra qualcosa di molto diverso. Solo per fare un esempio, ho il sospetto che non esistano parole specifiche per dire "molto", "molti", "numerosi": tali concetti vengono espressi con radici suppletive (una parola apposita per dire "molti uomini" la cui radice non è quella di "uomo") o tramite alterazioni delle parole a cui si riferiscono.

     ► Pietro: "L'elaborazione di tale neolingua ha richiesto tempo e fatica. Ora, i casi sono due: o si tratta dell'esperimento intellettuale, del divertissement di un erudito; o, invece, siamo di fronte a qualcosa di diverso - e in tal caso si tratta di comprendere per quali scopi sia stata concepita."

Una fatica considerevole costruire una simile opera, lo posso garantire. Sembra concepita da una o più persone con categorie mentali non umane. Se fosse un divertissement, per essere tale dovrebbe necessariamente essere condiviso, spiegato, reso pubblico. Non a caso ci sono in rete centinaia di pagine sulle più svariate lingue costruite: a volte sono soltanto abbozzi, altre volte si hanno dizionari e grammatiche. Sono più propenso a credere che gli scopi siano occulti e sinistri.

■  L'uso di convenzioni ortografiche inglesi spiega come mai siano usate le lettere C e K in modo promiscuo per esprimere l'occlusiva velare sorda /k/. Davanti a /e/ e /i/, C dovrà invece suonare /s/ nella maggior parte delle parole. Come criterio, se una parola è omofona di una parola inglese, si scrive allo stesso modo. Così MEAN "ebrei" è scritto come inglese MEAN "mediana".

■  Ho notato alcune cose molto singolari. I repertori di frasi presenti nelle varie pagine sono divisi in più sezioni. Ogni sezione, costituita da numerose frasi tradotte, le mostra sempre in ordine alfabetico a partire dalla prima parola in lingua sconosciuta di ogni frase. Sappiamo anche che il nome di tale lingua inizia con C.: tutte le frasi in lingua sconosciuta sono precedute da C., tutte quelle in lingua inglese da E. (chiaramente per "English").

■  Trovate ulteriori varianti di VAN, WEEN, MEAN "ebrei": VEN, WE. Un possibile genitivo plurale si trova in PAZCA WIME "interessi degli ebrei". WEMEM "come gli ebrei". Per esprimere il concetto di "ebrei liberali" si usa invece una parola diversa da quelle viste in precedenza: TERNOT, con la variante DERNES. Vocaboli ancora diversi sono usati quando alla parola è attribuito un senso peggiorativo o implicante ostilità (es. ORKI, FAIPOOR).

       ► Alessandra: "so che è la mente che lo fa, ma questo titolo d'un capitolo della pagina è intelligibile in Inglese: "Basti form been pig" non posso credere sia solo un gioco "casuale" queste cose hanno un senso...magari goliardico come dice Pietro, ma sotto la goliardata qualcuno ci ha speso denaro e tempo"

Con i monosillabi si può giocare all'infinito e ci si può ingannare. Succede anche con lingue più complesse, vedi le famose frasi latine "cane nero" (= canta, Nerone) e "i vitelli dei romani sono belli" (= vai Vitellio, al suono del dio romano della guerra). Fatto sta che in inglese "basti form been pig" non è una frase dotata di senso compiuto.

Le somiglianze con l'inglese sono illusorie, frutto dell'ortografia usata. Immaginiamo che in una lingua sconosciuta esista una parola che suona /'taunap/, e che si voglia scriverla all'inglese: ne risulterebbe townop (che in effetti si trova nelle pagine del sito). L'impressione sarebbe quella di una connessione con l'inglese town "città", ma è un miraggio, il significato non ha nulla a che vedere.

■  Ho trovato dei banner inseriti nelle pagine con i frasari. Sono bilingui e permettono ulteriori considerazioni.

PLOIVEN AUTOMATIK OSEN = Machine translation test.
HETZA AUXES OV ENGLITZA = Phrases translated into English
TE FINPELE NA DOLHAU = In alphabetical order
HETZA LAV ONMER 1 MENSIN ZEE MILDOKA = Phrases with 1st level expanded syntax

La parola AUTOMATIK in apparenza sembra un prestito da tradursi con "servomeccanismo". Ne siamo sicuri? No. Infatti è AUXES = translated. Così il verbo per dire "tradurre" è AU-, e AUTOMATIK significherà "traduzione". PLOIVEN = machine; OSEN = test.

Se è vero che gli autori della conlang sono molto interessati agli Israeliti, è pur vero che sono ancor più interessati al cambiamento climatico (per indicare il quale non ho ancora trovato alcuna radice coerente). Alcune frasi su questo argomento sono di una certa complessità. 

C: Rem govoix quiche coupihm, tagie could tous ciu would guaflo fun deupre paistir fuediar rarnal au eux felta god eshat, cos magten ten adol igtar wocpour gotpe kom hatnous seiket sion pre.
E: The new study, which blends climate and anthracite-cycle effects of large-lamina deforestation in a fully interactional three-numeral climate-carbon model, establishes that planting more steamy rainforests could help late global warming worldwide.
 

■  Frasi pornografiche sembrano rappresentate. Non si trova invece alcuna discussione tecnica sul sesso: le uniche occorrenze sono quelle di un vocabolo SEX della lingua sconosciuta, il cui significato è ovviamente del tutto dissimile.

C: Futjar rait, franba rap com minmil sov lionlam pracder pritbeim temcia ag nenliv pec otri, tion aal tel li brinsa ges fai frentier chezehn largul quandout warhou tio tatgauc wouldos cuher bu vio.
E: She did, growling and then grumbling loudly as she tossed herself off against his touches, her sticky cum juice trickling out over his handles as he interrogated them inside her. 

C: Gundus ginn hind tioncet feocom vie fucue bio aiva hos paix vaz testet istans ceimet heldins ihnel voir adtout kon sionrar.
E: Her white silky scanties clung to her legs and elevate end as they became crammed with oozy cum. 
 

C: Ceraf kermun ka barit lea par troisher, tro samtos ich chaphil erco ris sibgal cuan porgeld bonn carex nal tabjekt bube wircour genau.
E: Her face was burdened with adhesive, half dried cum and several of the latest load was sodden down her chin. 
 

C: Sievel halbout can docsab jarham talbu trol hu liar traistark heitvoi genhis comat los moicuat.
E: Blunder just liked to show her how many cum she he had gotten out of her.

C: Stanlein vestem ihmauch ding laixa socha lebam mier licheu falseem jab kei plidi lib couldam redris berlier sur fo.
E: Eight times he rushed sperm into her abdomen as his own cum made him and they orgasmed together.

C: Felter bat non allab reewe spa hildas was jue e socien zusoit ein ich of hu euxseen ezb macwa pub bien coopoint en guala.
E: She did her normal engrossing routine which collection them wild and presently she had two more spoonfuls of hot black sperm.

C: Par sisbad farap cemhat croisgunva op wingu.
E: A lot of sperm have been set here. 
 
 

        ► Pietro: "È una burla fabbricata da non-goy."

Non mi sembra che quelle genti abbiano il costume di perdere il loro tempo e le loro risorse per imprese che non portano frutto alcuno. In particolare per le burle, che sono per definizione cose vane.

        ► Pietro: "Traggono diletto dal burlarsi dei goym e hanno una passione inveterata per la pornografia."

Potrebbero burlare giusto me e un paio di altri internauti con la passione degli studi filologici, ma non di più. Per la massima parte della gente, quelle pagine sono soltanto spam, non meritevoli nemmeno di un istante di attenzione. Continua a non convincermi.  

      Pietro: "Gli autori di questo scampolo di prosa recitano lo Shacharit."

Non ne sono convinto. Sembra che la mentalità soggiacente sia molto diversa. Questa lingua è per struttura e modo di funzionare agli antipodi di una lingua semitica. Anzi, è la totale negazione del "culto della lettera". Guarda ad esempio gli esoteristi italiani, forgiati alla scuola del cabalismo. Analizzano le lettere che compongono una parola facendo conti sul valore numerico, cercano di interpretare gli anagrammi, e via discorrendo. Invece qui abbiamo una lingua in cui le consonanti non sono stabili e una singola parola subisce a seconda del contesto modificazioni profonde.

È necessario approfondire la semantica, che è molto sottile e insidiosa. In almeno due frasi la parola ORKI esprime il concetto di "scrittura" e di "scrivere". Ne consegue che ORKI "ebrei" significa "genti del Libro".

      Alessandra: "nel senso dell'Ahl al-Kitab (gente del Libro) islamica?"

Sì, qualcosa del genere. Anche se in tutti i casi in cui l'Islam è menzionato nel sito, è con parole di fortissima condanna.

Ho potuto identificare una radice per indicare l'Islam: THEDO, con la variante THEIR. Ne esistono però diverse altre che non hanno nulla a che fare. Comincio a credere che questa lingua faccia largo uso di kenningar.

      Alessandra: "ieri mi sono imbattuta in questa frase, dove pare esservi un nome proprio:
C: Bledeed, yeaho zehnis ying grie funfab, pla clubcen jahr, tri ristiel.
E: Eve, alongside vegetables weak and lower, speaks within it, cleaning weakened.
---BLEDEED è EVE , secondo te?"

Sì, credo proprio di sì. Siccome il nome Eva è da una parola ebraica che ha come significato "vita", si deduce che BLEDEED ha a che fare con "vivere", "vita". Bisogna scremare le corrispondenze, identificare le varianti di una stessa radice da sinonimi e kenningar. È anche possibile che la parola per indicare il "vegetale secco" sia diversa da quella per indicare il "vegetale", così come per "ebreo liberale" si usa una radice del tutto diversa da quella per dire "ebreo".
Non è sempre chiaro se certe frasi siano il prodotto di sostanze psichedeliche o di difetti del traduttore automatico. Tuttavia nel secondo caso, perché non correggere tali errori?

■  Ci sono frasi dalla struttura stereotipa, che non permettono di isolare con sicurezza i singoli componenti. Esempi:

C: Reaslu bres, delque, don vei ponto sousins cuar lit pibre.
E: The figs, quarrels, and cars are all broad and clever.
 

C: Mocmu wirtat, creabet, malses meistins nemlier bretem hes round sersui zenie.
E: The figs, cynics, and jackets are all sound and young.
 

C: Pag cuobrar detlai, yu, mehr fin eks ruar papo sachil mae acpart oh.
E: The frogs, slates, and raindrops are all oil and sharp.
 

Sembra che si siano fatti un viaggio nel Paese delle Meraviglie di Alice...

C: Yeahjuin mem dennest, dow, dem reic four razgan klarha yeahsur irjour.
E: The cats, shoots, and raindrops are all gelid and thin.
 

■  Sono definiti ben otto diversi livelli di sintassi espansa. Le sezioni dei frasari sono relative al "livello di sintassi espansa". Cosa questo possa significare è per il momento abbastanza fumoso. Una domanda cogente. In cosa consiste il livello di sintassi espansa delle frasi elencate nelle pagine del sito? Per quanto ci pensi, non trovo nessuna differenza concettuale tra frasi di primo livello, di secondo livello, etc. Così se riporto otto diverse frasi prese a caso dal sito, senza sapere la loro sezione di appartenenza, non trovo nulla che possa permettermi di classificarle.

Una seconda domanda. Perché mai elencare le frasi ordinandole alfabeticamente a partire dalla prima parola in lingua sconosciuta?

Comincio a compilare un dizionario con annotazioni, a tempo perso e senza fretta. Nel file trascrivo tutte le possibili corrispondenze trovate. Vediamo a dove porterà tutto ciò.

      Alessandra: "Marco sempre nella pagina di EVE... ci sono RIGHE che riportano questa parola connessa ad alcuni aggettivi particolari che richiamano il senso di LOWER e weak...eccole:
C: Bledeed, yeaho zehnis ying grie funfab, pla clubcen jahr, tri ristiel.
E: Eve, alongside vegetables weak and lower, speaks within it, cleaning weakened.

C: Dayvie eljui seclor gorcau mar fab wennil ijour ub ni cultav.
E: Other lower dry vegetables will improve sleepily throughout books.- C: Riaseu zulning ent sepas ment mulkurz voixcor clas sucneun trucreg tutwas kak beingins. (&)
E: Some empty old trifles partly call as the nasty vegetables dye.-----

"i termini tradotti con l'inglese VEGETABLE potrebbero appartenere a una CATEGORIA SEMANTICA particolare magari connessa al nome EVE..."

Non sono sicuro che ci sia una connessione. In una frase di quinto livello abbiamo che EVE traduce BRENAC:

C: Brenac, relwas mas, achout sunals druckart, lesart nis ont fir tun per.
E: Eve, still killing, provokes almost furiously, as the drier hates between their ticket.
 

Secondo livello: EVE traduce CORP

C: Corp, opmin diesget fon bleibis perif, old coicien asco mio, lumil vartes.
E: Eve, towards milliners strange and dull, provokes within it, covering partly.
 

La frase in lingua sconosciuta è seguita dalla stringa {pos}. Compaiono a volte nomi propri, in genere come prime parole di una frase, seguite da virgola. Così KOP è tradotto con Ed. In attesa di un programma utile, bisogna cominciare a raccogliere tutte le parole isolate da una virgola all'inizio di una frase, con corrispondente parola in inglese pure isolata da virgola, tipo "BLEDEED, etc."= "EVE, etc." Le possibilità di una corrispondenza esatta sono massime.

Molto di rado si trovano parole uguali, a quanto sembra, e quando accade pongono più problemi di quanti contribuiscano a risolverne. Anche per concetti come "ora", "talvolta", "occasionalmente", si trova una gran varietà di lemmi diversi.

Informazioni sul dominio

Questo link riporta le informazioni sul dominio di Translatish.com:


Il sito è stato registrato nel 2001 negli USA. Ho letto in un forum che il dominio originale apparteneva a un polacco, se non vado errato a un dentista. Poi sarebbe stato preso e trasformato così. Non so però quanto l'informazione sia attendibile.

Siti simili

Ho scoperto l'esistenza di un sito del tutto simile, scritto nella stessa lingua:


La struttura è identica a quella di Translatish.com, con un'unica eccezione: l'iniziale che marca le frasi in lingua sconosciuta nelle pagini bilingui è B. anziché C., cosa che mi ha fatto dubitare dell'ipotesi che il nome di questo idioma inizi con la lettera C.

Ci sono file pdf scritti nella stessa lingua, che non si riesce a scaricare, perché chiede di fare login. Ho visto che in un sito, accessibile soltanto in copia cache, ci sono anche alcuni link che rimandano a pagine scritte in una conlang di base neolatina e di sapore vagamente occitano chiamata Interlingua, tra cui anche la traduzione di un'opera di Conan Doyle. Poi ho visto un file pdf, sempre inaccessibile, la cui anteprima presenta un testo in basco. Sembra anche che alcuni risultati delle ricerche in Google mostrino scritti nella lingua sconosciuta in siti pornografici di incesto, da cui mi sono tenuto alla larga.

Potrebbe davvero trattarsi di spam? A mio parere siamo di fronte a qualcosa di molto diverso. Mi sono imbattuto in numerose occasioni in splog, ossia blog generati in automatico da macchine apposite che producono testi casuali. Di solito sono usate per inquinare una piattaforma e portarla al collasso. È successo ad esempio con Splinder. Non si tratta dello stesso fenomeno.

P.S.
Durante la compilazione di questo scritto, ho scoperto che esiste, incredibile dictu, anche un sito che riporta traduzioni in italiano:


Le pagine bilingui, in cui le traduzioni in italiano sono marcate con E., sembrano essere ospitate nel sito, nato in francese, come un organismo parassita. Spesso ai testi italiani sono mescolate parole e locuzioni in francese, come se la traduzione fosse stata eseguita automaticamente da quella lingua, con tutte le imperfezioni del caso. 

Reazioni nel Web

1) Un russo si è posto le stesse nostre domande, senza arrivare a nulla di conclusivo.


2) In un sito, Godlikeproductions.com, si ventila l'idea che questa sia la lingua dei fantomatici Illuminati, la setta a cui i complottisti attribuiscono immensi poteri e controllo sul mondo intero. La lista dei tentativi di traduzione trovati in Godlikeproductions.com è completamente erronea. L'autore si basava su rozze assonanze con la lingua inglese, ottenendo banali equivalenze contraddette dal materiale del sito.
SISFIN
è "unhappily" (tra le altre cose), di certo non "sixty"
 

3) Un interessante commento compariva sul sito DIS.4CHAN.ORG, ora distrutto. Anonymous : 2010-03-19 20:45 is very right. There is no obvious redundancy in the translation examples which is very unnatural. Also, translable and translatish makes big efforts to exclude redundancy in the English counterpart as well. No European language matches. Remote languages are unlikely because of the comma-separated phrase fragments being in almost original length. It is certainly not a dumb fake, it is too sophisticated. It looks like a perfect machine translation (this is also what the add says) but obviously the wordbook is not one of the natural language pairs but might well be a random list if not for one side for both - which might exclude any etymological relationship between contextual related words.
Purpose: unknown. Boost you page ranking by including all misspelled words that could ever occur.


Tentativo di compilazione di un glossario

Questo è un glossario di parole dedotte dall'analisi di frasi, assumendo che se un lemma compare all'inizio di una frase seguito dalla virgola, e lo stesso accade nella traduzione, si possa assumere che la parola della lingua sconosciuta sia tradotta da quella inglese. Ecco cosa si ottiene: 

AI = yesterday
AINMI = yesterday
AM = yesterday
BALD = yesterday
CA = yesterday
CICTOU = yesterday
DESMARK = yesterdays
FOODZUG = yesterday
HOMKOA = yesterday
LEURAN = yesterday
NIERMUN = yesterday
NONWEIL = yesterday
PORTOUR = yesterday
RIONE = yesterday
RIPROB = yesterday
ROADRI = yesterday
ROT = yesterday
SAGZENT = yesterday
SPAFORT = yesterday
YET = yesterday
YO = yesterday 

BERMOST = tomorrow
CHENING = tomorrow
CLO = tomorrow
CREERTIO = tomorrow
FOUNDIS = tomorrow
GAINDERN = tomorrow
GRIFE = tomorrow
KEN = tomorrow
LAWFEB = tomorrow
MALAFDON = tomorrow
MUST = tomorrow
NAR = tomorrow
NO = tomorrow 
OGO = tomorrow
RAU = tomorrow
SERUM = tomorrow
SIBVON = tomorrow
SO = tomorrow
SOR = tomorrow
SORLAM = tomorrow
VIENEM = tomorrow
WARDENN = tomorrow
XOR = tomorrow
 

AGDOING = occasionally
ALS = occasionally
DIB = occasionally
DO = occasionally
EST = occasionally 
EU = occasionally
GOUHA = occasionally
GUALTAN = occasionally
IZQUAND = occasionally
KERBEST = occasionally
KIND = occasionally
PEU = occasionally
PIEL = occasionally
RAM = occasionally
RE = occasionally
SEN = occasionally
SEZFO = occasionally
SIC = occasionally
SHORTE = occasionally
STUCKEM = occasionally
TAG = occasionally
TOLD = occasionally
 

Solo poche di queste forme sembrano tra loro compatibili (es. AI - AINMISO - SOR; YET - YOSEN - SEZFO, etc.) e derivate da una stessa radice, mentre il loro numero e la loro varietà sembrano virtualmente infinite, potendosi formare quasi per generazione spontanea.

Il mistero di un bizzarro vocabolo è stato invece risolto: 

MEOKURZ = CONSEQUENTLY; TO BE FOR SEVERAL DAYS; TO PASS ON, etc.

C: Meokurz tiftan baugland apsor hair viport chef eltaitrer nacpou col bih.
E: Christ was in the crypt for three daytimes and three nights.

C: Lorlo unp fronrel cluir vion meokurz tries.
E: Maybe this comes consequently to some people.

C: Lordel elhui cruz femve gesland rammos florask men meokurz trairan pliclu efa sionap.
E: But a juggernaut which is information has past on from that.

Conclusioni

Alla fine, ho deciso di lasciar perdere, perché non si veniva a capo di nulla. Se si tratta di un codice, è al di fuori della mia portata. Per risolvere il mistero di Translatish.com occorre un sequenziatore, un programma che confronti le frasi in lingua sconosciuta con le corrispondenti frasi in inglese, incrociando le parole, cercandone in automatico le corrispondenze. 

Nessun commento:

Posta un commento