Buscador de expresiones regulares en textos ibéricos

Búsqueda por nomenclatura MLH

Introduzca la referencia del texto:

Busca los textos cuya referencia comience por el texto introducido. Por ejemplo, "C.001" devuelve todos los de Ampurias. Hay completar con ceros iniciales, de manera que tanto el número de yacimiento como el de inscripción tengan tres dígitos.

Los textos ibéricos están introducidos como ficheros independientes, uno por cada texto, cuyo nombre coincide con la nomenclatura de los Monumenta Linguarum Hispanicarum (II y III) de Jürgen Untermann, de donde se han extraído en su mayoría. En los publicados con posterioridad, si no se ha dado a conocer esta nomenclatura, se suple con una provisional a partir de X.0.2. Los textos se han introducido tal como aparecen en los Monumenta, con la salvedad de que, al tratarse de ficheros ASCII, se han sustituido los signos s y r con tilde por la correspondiente mayúscula. Del mismo modo, para transcribir el signo ibérico Y se ha utilizado la M mayúscula. Ello implica que el programa buscador discrimina mayúsculas y minúsculas, por lo que los textos deben introducirse SIEMPRE EN MINÚSCULAS, salvo los caracteres mencionados. Es posible, incluso conveniente en ocasiones, utilizar "clases de caracteres". Por ejemplo, [sS]ali[rR] localizaría todos los textos en que aparezcan Salir, salir, SaliR o saliR. Resulta útil para incluir vacilaciones ortográficas, y especialmente es aconsejable en el caso de las oclusivas, para incluir resultados con sonora que aparecen en textos en alfabeto greco-ibérico.

Instrucciones de uso

Pueden introducirse directamente cadenas de texto ibérico, teniendo en cuenta que deben teclearse en minúsculas, reservando las mayúsculas para la transcripción de la segunda vibrante (R), silbante (S) y el signo Y (M). Además, pueden usarse expresiones regulares. Se han previsto varias abreviaturas para algunas expresiones regulares que pueden resultar especialmente útiles. Son las siguientes:

C (consonantes) = [bptkdgmMnlrRsS];
V (vocales) = [aeiou];
T (dentales) = [td];
K (velares) = [kg];
P (oclusivas) = [pbtkdg];
Z (silbantes) = [sS];
Q (vibrantes) = [rR];
Y (sílaba) = ([btdkgmMnsSlrR]?[aeiou][iu]?[nmMlrR]?[sS]?);
L (sonantes) = [nmMlrR].

De esta forma puede teclearse ZaliQ en lugar de [sS]ali[rR]

El punto (.) es un metacarácter usado en las expresiones regulares. Como también se ha usado para representar el signo de interpunción, siguiendo la transcripción de MLH, éste deberá ir precedido de la secuencia de escape \, para indicar que no es un metacarácter (así, iskutur\.iteRoke).

Como metacarácter, . significa "cualquier carácter, alfanumérico o no" (incluyendo espacios en blanco o saltos de línea). Puede usarse .+ ("uno o más caracteres") para ver todos los textos ibéricos.

Otros metacaracteres especialmente útiles son \w ("carácter alfanumérico"), \W ("carácter no alfanumérico", es decir, signos de puntuación, espacios, etc.), \b ("límite de palabra", entendida como ristra ininterrumpida de caracteres alfanuméricos).

Cualquier carácter o metacarácter (especialmente ".", \w o \W) puede ir seguido de cuantificadores: * (cero o más), + (uno o más), ? (cero o uno), {n,m} (entre n y m), {,m} (entre cero y m) , {n,} (como mínimo n).

Sobre las expresiones regulares puede consultarse el excelente manual de Jeff "Japhy" Pinyan, disponible en japhy.pelmonk.org/book.

De las dos ventanas de texto, sólo es necesario usar la primera. Si se usa también la segunda, sólo apareceran textos que muestren coincidencias con las dos cadenas o expresiones regulares introducidas. Si la secuencia a buscar es breve, puede ser útil descartar los numerosos textos breves (como grafitos sobre cerámica), poniendo una cifra pequeña en la casilla correspondiente.

Si la cadena buscada aparece en muchos textos, el uso de la opción de mostrar nombres personales (que aparecen subrayados) puede ralentizar notablemente el programa.

Se marca con un asterisco la referencia bibliográfica de la que se ha obtenido cada texto. Las posibles variantes de lectura aparecen bajo el texto bajo el encabezado V1 para la primera lectura discrepante, V2 para la segunda, etc. Estas mismas siglas se usan para indicar la bibliografía de dichas variantes en cada texto. Normalmente no se transcribe el texto completo en cada variante, especialmente si el texto es largo, sino que se transcriben únicamente las líneas discrepantes con indicación del número de línea y la letra para indicar cara A o B si corresponde.

Se ruega comunicar cualquier fallo observado, así como cualquier sugerencia, al autor.

Buscador de expresiones regulares en textos ibéricos

Introduzca la expresión:

Búsqueda por nomenclatura MLH

Introduzca la referencia del texto:

Instrucciones de uso