Resultados 1 al 4 de 4

Tema: Extraer caracteres japoneses de un Manga

  1. #1
    Cinturón Marrón Avatar de ultraman
    Fecha de ingreso
    15-07-2018
    Mensajes
    582
    Agradecimientos: 649

    Predeterminado Extraer caracteres japoneses de un Manga


    Seguramente alguno de ustedes tienen algún manga favorito en su PC y desean extraer el texto ya que no hay traducción por ningún lado y quizás se animen a estudiar japonés por su cuenta. Empecemos con esta única imagen de ejemplo:


    Vamos usar Online OCR que es el que utilizo desde el año pasado. Es fácil de usar. Sólo subes una imagen, seleccionas el idioma y click en converter. Al subir la imagen de arriba nos damos con la sorpresa que no reconoce el texto:


    El problema aquí son los caracteres pequeños llamados okuriganas que están al costado de los kanjis. Tenemos que borrarlos y los 2 signos de interrogación, ya que estos últimos a veces lo traduce como otros caracteres:


    De tal manera que la nueva imagen queda de esta otra forma. Hay que tener en cuenta que no exista alguna "basurita" alrededor de los caracteres:


    Dicho todo lo anteror, resubimos esta nueva imagen y ahora si hay resultados:


    Revisando la extracción, confirmo que está correcta. Copio ese texto y lo amplio:


    A veces, dependiendo del tamaño de los caracteres y de otros factores no puede extraerlos esa página. En ese caso seleccionan por partes los caracteres que desean y lo guardan como jpg. En nuestro ejemplo, se podría seleccionar la primer linea vertical, luego la otra ó solo un caracter.

    ¿Y ahora que pasa si no podemos extraer un determinado kanji?. Digo esto porque los más básicos son 2,136. El resto de los caracteres se encuentran en los silabarios del Hiragana y del Katakana por lo que no hay problema.

    Tomemos de ejemplo la imagen inicial del diálogo de Fantasmagórico que en este manga si habla pero en el anime sólo se ríe:


    Ahí he seleccionado los 3 kanjis encerrados en círculos. El resto son caracteres del Hiragana y Katakana. Supongamos que no se pueda extraer estos kanjis. ¿Qué hacemos? ¿Miramos la lista de los 2,136 kanjis para poder localizarlos?

    ¡No!. Nos vamos a la página de Jisho donde seleccionamos radicales. ¿Qué son los radicales? Son partes de un kanji que nos sirven para identificarlos. Si una casa fuera un kanji, entonces la ventana sería un radical. Para poder identificar esos 2,136 kanjis se utilizan estos 214 radicales:


    En la imagen anterior, había identificado a los kanjis: K1 (), K2 (), K3 (). Lo primero que hay que hacer es que si tienen una buena vista, ver si el kanji K1 está entre esos 214 radicales porque los kanjis también pueden ser radicales. Ya les digo que no está. Cada número, son los trazos de cada uno de ellos.

    K1 ():

    Lo que tenemos que hacer es hacer click en los radicales que podrían formar parte del kanji. De esta manera, aparecerán en la parte superior, una lista de posibles candidatos. Cuanto más radicales correctos, esa lista se reducirá.


    En este ejemplo, el radical que seleccione, hace que aparezca en esa lista. Y si selecciono otro radical como , reduce esa lista y ya podemos ver claramente nuestro kanji al inicio de esta imagen:



    K2 (黄) y K3 (金):

    Estas 2 kanjis son radicales por lo que no hay necesidad de buscar sus partes. Usar el buscador del navegador y los sacas rápido. Pero como ejemplo, les dejo las imágenes:





    Eso es todo, asi de fácil


  2. Los siguientes 4 usuarios agradecen a ultraman por este tema:


  3. #2
    Colaborador Asia-Team Avatar de MTorrN94
    Fecha de ingreso
    14-07-2017
    Mensajes
    1,024
    Agradecimientos: 1370

    Predeterminado

    Interesante. Yo no traduzco manga, pero para extraer el texto de una imagen (incluyendo caracteres asiáticos) uso Documentos de Google. Se que he extraído texto escrito en vertical en japonés, pero no recuerdo si lo hice así nomas, o si edité la imagen y lo puse en horizontal, debería reconocerlo igual.
    Por ejemplo este es el resultado que me da tu imagen sin editar:
    黄わ
    金た バし
    ト名
    Y este es el resultado de la segunda imagen:
    わたしの名は 黄金バット
    Como bien mencionas los caracteres pequeños a veces causan problemas, y en este caso ya me lo puso directamente en horizontal y no en vertical como antes.

    En caso de que falle (por si los caracteres están difuminados, el texto ocupa toda la imagen o lo sea) lo que hago es editar la imagen, o bien recurrir al traductor de Google usando la escritura a mano, con esto dibujas el caracter y el traductor trata de reconocerlo y te ofrece una lista de posibles coincidencias.
    Spoiler:
    SPOILER:


    Un ejemplo sencillo escribiendo el katakana del TA


    Y el FU


    Incluso con una mala caligrafía como la que mostré es capaz de reconocer ciertos caracteres sencillos y otros no tan sencillos, pero en alguna que otra ocasión será necesario una mejor caligrafía.

    No son métodos perfectos pero supongo que puedan ayudar.

    Probaré este método la próxima vez que necesite extraer texto a ver que tal funciona. Ya desde el vamos parece mas sencillo de utilizar.

    Saludos amigo .

  4. Los siguientes 2 usuarios agradecen a MTorrN94 por este tema:


  5. #3
    Cinturón Marrón Avatar de ultraman
    Fecha de ingreso
    15-07-2018
    Mensajes
    582
    Agradecimientos: 649

    Predeterminado

    @MTorrN94 Podemos concluir que al haber hecho ese experimento con google, cuando la imagen esta limpia de caracteres pequeños, lo traduce en el orden correcto de derecha a izquierda como si estuviera leyendo un manga

    El Jisho tiene la opción como en el google de escribir. Dibuje el kanji 十 y salio en la lista superior. Pero fue de varios intentos ya que no era una cruz, sino un poquito mas arriba la linea vertical jaja. Pero prefiero con imagenes, porque si así me he demorado para que salga bien la cruz, como sera una más complicada.


    Saludos

  6. Los siguientes 2 usuarios agradecen a ultraman por este tema:


  7. #4
    Cinturón Marrón Avatar de ultraman
    Fecha de ingreso
    15-07-2018
    Mensajes
    582
    Agradecimientos: 649

    Predeterminado

    @MTorrN94 intenta dibujar este kanji de 57 trazos a ver que sale

  8. Los siguientes 2 usuarios agradecen a ultraman por este tema:


Información de tema

Usuarios viendo este tema

Actualmente hay 1 usuarios viendo este tema. (0 miembros y 1 visitantes)

Temas similares

  1. Tu Nombre en caracteres Coreanos :D
    Por MagiGreen en el foro Desvaríos y Otros Cuentos
    Respuestas: 305
    Último mensaje: 20-07-2018, 19:49:42
  2. Extraer tiempos de un subtitulo incrustrado
    Por Amai namida en el foro Oficina Traductores y Correctores
    Respuestas: 16
    Último mensaje: 01-02-2014, 09:35:46
  3. Extraer Subtitulos
    Por Bowen en el foro AYUDA
    Respuestas: 1
    Último mensaje: 10-12-2012, 11:13:42
  4. ¿Cómo extraer el Subpack de un DVD?
    Por Maedhroz en el foro Manuales y Tutoriales
    Respuestas: 4
    Último mensaje: 20-04-2010, 19:59:17
  5. Manga Fox: manga online en ingles
    Por Gedece en el foro General Anime
    Respuestas: 1
    Último mensaje: 18-05-2008, 17:02:47

Marcadores

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •