뉴스·보도자료
업계 뉴스와 보도자료를 확인하세요.
HWP 텍스트추출 SDK 릴리즈
자유소프트는 AI 구축작업에 필수적인 문서 텍스트추출 SDK를 일반에 제공하기로 했다고 밝혔다.
LLM의 대중화로 인해 기존 문서 파일에서 내용을 추출하여 새롭게 지식기반 데이타베이스를 구축하는 사례가 급증하고 있다. 특히 관공서의 경우 대부분이 HWP 파일로 저장되어 있는 경우가 많고 외부 문서의 경우 PDF 포맷으로 저장되어 있는 바, 두 종류의 파일 포맷이 AI 개발자들에게 걸림돌이 되어 왔다.
HWP 파일은 DOCX처럼 XML 포맷이 아니고 바이너리 문서인 까닭에 AI 엔진에서 쉽게 데이터를 추출해갈 수가 없다. 또한 PDF 역시 구조적인 문서포맷이 아닌 비구조적 문서인 관계로 형식을 이해하여 가져가기가 어려운 현실이다.
자유소프트는 이에 착안하여 다년간의 관련 기술 개발 경험을 되살려 HWP나 PDF, DOCX 문서로부터 텍스트나 JSON 형식의 문서속성을 추출하는 SDK를 공개하기로 하였다.
텍스트 추출은 겉으로는 크게 다르지 않을 것 같지만 실제로는 문서 속성을 빠짐없이 가져와야하기 때문에 생각보다 그리 쉽지가 않다. 국내 문서들은 대부분 “표” 를 많이 이용하기 때문에 표안에 들어있는 구문들을 추출하기 위해서는 특별한 노우하우가 필요하다.
PDF 또한 오픈소스 종류들을 쉽게 구할 수 있지만 품질을 비교하고 나면 상용 솔루션을 찾게 될 것이라고 밝혔다.
자유문서추출기(DocuExtractor)가 필요한 개발자들은 위해 온라인으로 품질을 테스트할 수 있는 포털(convert.jayoo.kr)을 제공한다.
12.1.0 버전이후에 업데이트된 보안홀 내역
CVE-2024-29072 |
CVE-2024-30322, CVE-2024-30324, CVE-2024-30325, CVE-2024-30326, CVE-2024-30327, CVE-2024-30328, CVE-2024-30329, CVE-2024-30330, CVE-2024-30331, CVE-2024-30332, CVE-2024-30333, CVE-2024-30334, CVE-2024-30335, CVE-2024-30336, CVE-2024-30337, CVE-2024-30338, CVE-2024-30339, CVE-2024-30340, CVE-2024-30342, CVE-2024-30343, CVE-2024-30344, CVE-2024-30345, CVE-2024-30346, CVE-2024-30347, CVE-2024-30350, CVE-2024-30351, CVE-2024-30352, CVE-2024-30353, CVE-2024-30355, CVE-2024-30357, CVE-2024-30348, CVE-2024-30358, CVE-2024-30349, CVE-2024-30363, CVE-2024-30364, CVE-2024-30367, CVE-2024-30371) |
CVE-2024-25938, CVE-2024-25648, CVE-2024-25575 |
CVE-2024-30323, CVE-2024-30360, CVE-2024-30361, CVE-2024-30362, CVE-2024-30341, CVE-2024-30354, CVE-2024-30359, CVE-2024-30365, CVE-2024-30366 |
CVE-2024-30356 |
CVE-2024-25858 |
CVE-2024-32488 |
CVE-2023-51549, CVE-2023-51550, CVE-2023-51552, CVE-2023-51554, CVE-2023-51553, CVE-2023-32616, CVE-2023-41257, CVE-2023-38573, CVE-2023-51555, CVE-2023-51556, CVE-2023-51557, CVE-2023-51558, CVE-2023-51559, CVE-2023-51551, CVE-2023-51562 |
CVE-2023-40194, CVE-2023-35985 |
CVE-2023-51560 |
CVE-2023-42089, CVE-2023-42090, CVE-2023-42091, CVE-2023-42092, CVE-2023-42093, CVE-2023-42094, CVE-2023-42095, CVE-2023-42096, CVE-2023-42097, CVE-2023-42098 |
CVE-2023-39542 |
CVE-2023-28744, CVE-2023-38111, CVE-2023-38107, CVE-2023-38109, CVE-2023-38113, CVE-2023-38114, CVE-2023-38112, CVE-2023-38110, CVE-2023-38115, CVE-2023-38117, CVE-2023-27379, CVE-2023-33866, CVE-2023-32664, CVE-2023-33876 |
CVE-2023-38105, CVE-2023-38106, CVE-2023-38108, CVE-2023-38116 |
CVE-2023-38119 |
CVE-2023-38118 |
CVE-2023-27363 |
CVE-2023-27364, CVE-2023-27365 |
CVE-2023-27366 |
CVE-2023-27331, CVE-2023-27330, CVE-2023-27329 |
조달청 나라장터, 디지털서비스몰로 변경
조달청 나라장터 종합쇼핑몰이 디지털서비스몰을 새로 운영함에 따라 ‘자유PDF’ 구매하는 싸이트 역시 디지털서비스몰로 변경되었습니다.
해당 제품의 링크를 따라가면 바로 구매 페이지로 연결됩니다.
1년 구독형 식별번호 24402749 가격 69,300원 바로 가기 –> 조달청 디지털서비스몰 (g2b.go.kr)
영구버전 식별번호 24402750 가격 148,500원 바로 가기 –> 조달청 디지털서비스몰 (g2b.go.kr)
점역 소프트웨어 점사랑 3.0 개발 완료
자유소프트는 국립국어원의 의뢰로 문서를 점자로 번역하고 또 반대로 점자를 역점역하는 점역 프로그램 점사랑3.0을 개발하여 발표하였습니다.
MS 워드 문서나 아래아한글 문서를 불러들여 점자화 할 수 있는 워드프로세서 프로그램입니다.
프로그램을 다운로드받거나 사용상의 개선사항을 올려주실 분들은 점사랑 홈페이지를 방문바랍니다.
자유PDF, GS 1등급 획득
자유소프트(대표 신미애)는 지난 9월 16일자로 자유PDF가 GS 1등급 인증을 통과했다고 발표했다.
자유PDF는 새 버전 10을 한국정보통신기술협회 산하 TTA가 시행하는 소프트웨어 품질 인증시험에 응하여 최종 통과되었다.
