이전 글 : 2023.11.16 - [Project/Math_Photo_Project] - [1] Project의 시작 - idea
GitHub을 구경하던 중... LaTeX-OCR이라는 repasitory를 발견하였다.
lukas-blecher.github.io/LaTeX-OCR/
세상엔 똑똑한 사람이 너무 많다...
우선 README.MD를 읽어보며 Anaconda에 가상 환경을 만들긴했다.
아무래도 AI이다보니 PyTorch가 필요하다고 한다. (아직 공부 안했다 ㅠㅠ)
Docker도 tool로써 사용하는것 같은데, 저번에 AgentGPT를 설치할 때 조금 공부하다가 도저히 무슨 내용인지 몰라 포기했었다. 이번 기회에 다시 공부해봐야겠다.
위 문제를 다운받아, 예제 코드를 실행시켜 보았다.
결과 )
\begin{array}{r l}{{\Longrightarrow{\mathrm{man}}_{\mathrm{D}}}}\\ {{\mathrm{~}}}&{{\sqrt{125}+3{\sqrt{2}}-{\frac{16}{\sqrt{32}}}-{\frac{16}{\sqrt{2}}}{\large(}}}\\ {{\mathrm{~}}}\\ {{={\cfrac{\mathrm{}}{\mathrm{m}}{\sqrt{\Omega\cdot\mathrm{}}\mathrm{}}\mathrm{}}}\end{array}
LaTeX로 변환되긴 했다. 도저히 모르겠으니, 다시 수식으로 변환시켜보겠다.
(변환은 MD 문서의 $$를 이용할 예정)
문제가 생겼다. 수식을 하나씩 집어넣어보겠다.
{\sqrt{125}}+3{\sqrt{2}}-{\frac{16}{{\sqrt{32}}}}-{\sqrt{20}}
첫번째 수식을 집어넣었는데, 훨씬 깔끔한 결과가 나왔다.
예아~
프로젝트의 첫 문제 상황을 집어냈다.
<문제 1>
{수식}과 {문제 글}이 혼용되어 있을 경우, LaTeX 언어가 제대로 생성되지 않는다.
<문제 1>을 조금 더 세분화해서 문제를 검토해보겠다.
세분화 1 - {문제 글} + {문제 번호} + {수식}의 상황
세분화 1-1 - {문제 글} + {수식}의 상황
사용할 data image는 아래와 같다.
세분화 2 - {문제 번호} + {수식 1} + {수식 2}의 상황
세분화 2-1 - {수식 1} + {수식 2}의 상황
사용할 data image는 아래와 같다.
글이 길어져서 Data 추출 결과 및 분석, 문제 상황 정리는 다음 글에서 쓰도록 하겠다.
다음 글 :
'Python > [Project] Math_Photo_Project' 카테고리의 다른 글
[3] <문제 1> 분석 (1) | 2023.11.16 |
---|---|
[1] Project의 시작 - idea (0) | 2023.11.16 |