본문 바로가기
Python/[Project] Math_Photo_Project

[2] GitHub는 신이고, 나는 멍청하다.

by 한PU 2023. 11. 16.
728x90
반응형

이전 글 : 2023.11.16 - [Project/Math_Photo_Project] - [1] Project의 시작 - idea

 

GitHub을 구경하던 중... LaTeX-OCR이라는 repasitory를 발견하였다.

lukas-blecher.github.io/LaTeX-OCR/

 

LaTeX OCR

Handwritten formulae Use CROHME, Im2Latex-Handwritten and maybe https://www.kaggle.com/aidapearson/ocr-data

lukas-blecher.github.io

 

세상엔 똑똑한 사람이 너무 많다...

 

우선 README.MD를 읽어보며 Anaconda에 가상 환경을 만들긴했다.

아무래도 AI이다보니 PyTorch가 필요하다고 한다. (아직 공부 안했다 ㅠㅠ)

 

Docker도 tool로써 사용하는것 같은데, 저번에 AgentGPT를 설치할 때 조금 공부하다가 도저히 무슨 내용인지 몰라 포기했었다. 이번 기회에 다시 공부해봐야겠다.

 

[그림 1] - 수학 문제

위 문제를 다운받아, 예제 코드를 실행시켜 보았다.

결과 ) 

\begin{array}{r l}{{\Longrightarrow{\mathrm{man}}_{\mathrm{D}}}}\\ {{\mathrm{~}}}&{{\sqrt{125}+3{\sqrt{2}}-{\frac{16}{\sqrt{32}}}-{\frac{16}{\sqrt{2}}}{\large(}}}\\ {{\mathrm{~}}}\\ {{={\cfrac{\mathrm{}}{\mathrm{m}}{\sqrt{\Omega\cdot\mathrm{}}\mathrm{}}\mathrm{}}}\end{array}

LaTeX로 변환되긴 했다. 도저히 모르겠으니, 다시 수식으로 변환시켜보겠다.

(변환은 MD 문서의 $$를 이용할 예정)

[그림 2] - 문제

문제가 생겼다. 수식을 하나씩 집어넣어보겠다.

{\sqrt{125}}+3{\sqrt{2}}-{\frac{16}{{\sqrt{32}}}}-{\sqrt{20}}

첫번째 수식을 집어넣었는데, 훨씬 깔끔한 결과가 나왔다.

 

[그림 3] - 결과

예아~

프로젝트의 첫 문제 상황을 집어냈다.

 

<문제 1>

{수식}과 {문제 글}이 혼용되어 있을 경우, LaTeX 언어가 제대로 생성되지 않는다.

 

<문제 1>을 조금 더 세분화해서 문제를 검토해보겠다.

 

세분화 1 - {문제 글} + {문제 번호} + {수식}의 상황

세분화 1-1 - {문제 글} + {수식}의 상황

사용할 data image는 아래와 같다.

[그림 4] 세분화 1 (그림판으로 문제번호 지움 ㅎ)
[그림 5] 세분화 1-1

 

세분화 2 - {문제 번호} + {수식 1} + {수식 2}의 상황

세분화 2-1 - {수식 1} + {수식 2}의 상황

사용할 data image는 아래와 같다.

[그림 6] 세분화 2
[그림 7] 세분화 2-1

 

글이 길어져서 Data 추출 결과 및 분석, 문제 상황 정리는 다음 글에서 쓰도록 하겠다.

 

다음 글 :

2023.11.16 - [Project/Math_Photo_Project] - [3] <문제 1> 분석

728x90
반응형

'Python > [Project] Math_Photo_Project' 카테고리의 다른 글

[3] <문제 1> 분석  (1) 2023.11.16
[1] Project의 시작 - idea  (0) 2023.11.16