LanguageTool 일반 맞춤법 검사기 도구를 감지 할 수없는 오류를 발견하기위한 오픈 소스 교정 프로그램입니다. 그것이 규칙 기반 등 최대 & ldquo 혼합 등의 규칙은 XML 설정 파일에 정의되어있는 오류를 발견 할 것이다 스타일과 문법 검사기가 그들의 & rdquo; 와 & ldquo;.이 & rdquo;
다양한 문법 문제를 감지
프로그램은 다양한 문법 문제를 감지하고 영어, 독일어, 폴란드어, 프랑스어, 스페인어, 스웨덴어, 그리스어, 중국어, 덴마크어, 일본어, 아이슬란드 어, 포르투갈어, 포르투갈어 (브라질)를 포함하여 20 개 이상의 언어에 대한 지원을 제공 할 수 있습니다.
또한, 사람이 선택 맞춤법 할 필요가 텍스트를 붙여 넣을 수있는, 사용하기 쉬운 간단하고 직관적 그래픽 사용자 인터페이스를 자랑합니다. 그것은 클립 보드에 태그 텍스트, 잘라 내기 / 복사 / 붙여 넣기 텍스트를 텍스트를 확인하고 시스템 트레이 영역에 상주 할 수 있습니다.
광범위한 문제를 감지
는 옵션 대화 상자에서, 당신은 사용할 수있는 나쁜 스타일, 문법 오류, 속어, 문장 오류, 가능한 오타, 중복 문구, 일반적으로 혼란 단어, 말의 배치, 대문자, 의미뿐만 아니라 포함하는 응용 프로그램이 감지 할 수있는 문제의 유형 표준이 아닌 문구 등.
리브레 오피스와 오픈 오피스에 대한 LanguageTool
이 독립 실행 형 응용 프로그램을되고 게다가, LanguageTool 사용자가 그들의 텍스트를 교정 할 수 있도록, 또한 가장 인기 있고 강력한 오픈 소스 오피스 스위트, 리브레 오피스와 아파치 OpenOffice.org의 두에 대한 확장으로 사용할 수 선택한 문구를 마우스 오른쪽 버튼으로 클릭 또는 단락.
모질라 파이어 폭스에 대한 LanguageTool
또한, 응용 프로그램은 또한 추가 기능에 세계 했음 용으로 다운로드 할 수 있습니다, 세계, 모질라 파이어 폭스에서 가장 인기있는 오픈 소스 웹 브라우저. 그것은 다시 시작할 필요 없으며 당신이 웹 사이트 또는 양식에서 강조 표시된 텍스트를 교정 할 수 있도록 기본 도구 모음에있는 작은 버튼을 배치합니다.
후드 및 가용성에서
SA 크로스 플랫폼 소프트웨어, 어떤 GNU / 리눅스 배포판뿐만 아니라, BSD, 솔라리스, 마이크로 소프트 윈도우 및 Mac OS X 운영에서 작동하도록 설계
응용 프로그램은 했음이 있다는 것을 의미 자바 프로그래밍 언어로 작성된다 시스템은, 자바 런타임 환경이 설치된다.
이 릴리스의 새로운 기능 :
카탈루냐어 :
업데이트 POS 태그 사전
추가 된 새로운 규칙
고정 잘못된 경보
영어 :
몇 가지 잘못된 경보를 몇 가지 규칙을 추가 및 수정
헤이 키 Lehvaslaiho로 기여 추가 된 많은 새로운 스타일 규칙. 이러한 잘못된 경보가 발생할 수 있습니다, 그들은 기본적으로 활성화되어 있지 않습니다. 당신은 새로운 '쉬운 영어'카테고리의 모든 규칙을 설정하여이를 활성화 할 수 있습니다.
에스페란토 :
몇 가지 새로운 규칙을 추가
프랑스의
업데이트 POS 태그 사전 및 Hunspell 사전 Dicollecte-5.3하기
독일어
몇 가지 새로운 규칙과 고정 잘못된 경보를 추가
주제 동사 일치를 확인하는 새 규칙을 추가했습니다. 지금은 '경악', '순진', '전쟁'과 'Waren의'만 경우에 지원됩니다. 검출 된 오류에 대한 예 : '. 데르 개자리 신드 SCHA 및 파라; n'가, '자동차를 인도 표준시 슈넬 다이.' 그것은 또한 가지고 사용하는 반면, (MAS : NOM : SIN SUB)에만 주격 독서를 유지합니다 예를 들어, 문구에 '맨'은 '맨을 EIN':이 규칙 작업을하려면, 문구는 이제 disambiguation.xml에 통합된다 대격과 여격 판독 (SUB : AKK : SIN : MAS, 하위 : DAT : SIN : MAS). (https://github.com/languagetool-org/languagetool/issues/233)
이탈리아어 :
몇 가지 규칙을 개선
폴란드어 :
추가 된 몇 가지 새로운 규칙
포르투갈어
추가 / 개선 된 몇 가지 규칙
3695 복합어 (개혁 이전) - 최대 규모의 무료 데이터베이스
러시아어 :
추가 및 향상된 규칙
우크라이나어 :
큰 사전 업데이트
새로운 문법 규칙
새로운 간단한 부드러운 제안에 대한 규칙을 교체
disambiguator 개선
복합 태깅 및 맞춤법 개선
이니셜 태그 개선
문장과 단어 토큰 개선
스트레칭 기호와 하이픈의 향상된 처리
Bitext 규칙 :
(이 만 포함되어 있습니다.?! 자) 번역 원본과 같은 문장 부호로 끝나는 여부를 확인하기위한 간단한 규칙을 추가했습니다.
그것은 사용하여 명령 행에서 외부 bitext 규칙 파일을 추가 할 수있게되었습니다
-bitextrule 옵션을 선택합니다. 파일 경로는 절대이어야한다. 참고 :이 또한 기본적으로 포함 더 bitext 규칙이없는 언어 bitext 규칙을 사용 할 수 있습니다.
맞춤법 :
/hunspell/spelling.txt에서 새 파일은 맞춤법이 틀린 단어에 대한 제안을 만들 때 고려하는 맞춤법 검사기에 허용 된 단어를 추가 할 수 있습니다. 이 목록은 맞춤법이 틀린 단어에 대한 제안을 만들 때 * * 사용하지 않는 단어를 수락 /hunspell/ignore.txt 파일과 유사합니다.
API :
JLanguageTool.activateDefaultPatternRules ()와 JLanguageTool.activateDefaultFalseFriendRules ()가 제거 된 - JLanguageTool의 생성자를 호출 할 때 모든 패턴 규칙과 거짓 친구 규칙 (제 2 언어가 지정된 경우) 자동으로 활성화됩니다. 당신은 XML 기반의 패턴 규칙없이 검사를 필요로 하는가, getPatternRules () 메소드를 덮어 쓰고 거기에 빈 목록을 반환 한 언어 클래스 (예 : '영어')를 확장합니다.
ManualTagger.lookup은 () 최신 버전부터 사용되지 않습니다 후 ManualTagger.tag ()로 대체되었습니다
모든 정적 메서드와 클래스 '언어'의 필드는 새 클래스 '언어'로 이동되었습니다. 지금은 방법 / 수준의 언어 필드는 여전히 존재하지만 사용되지 않습니다.
LanguageIdentifierTools가 제거되었습니다. 대신 LanguageIdentifier 사용합니다.
제거 (기본값) ResourceDataBroker.setResourceDir ()와 setRulesDir ()이이 생성자를 설정할 수 있습니다로
클래스 참가자, 예를 들면까지 정리 ) (getRemark 제거
Category.setDefaultOff ()이 제거 된이 이제 생성자를 통해 설정할 수 있습니다
이름이 바뀐 클래스 : o.lt.rules.patterns.Element =한다 o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher =한다 o.lt.rules.patterns.PatternTokenMatcher
일반적인 사용 사례에 영향을 미치지 않습니다 기타 소형 API를 정리, 예를 들어, IncorrectExample.getCorrections () 반환 및 변경 불가능한 지금 목록, 사용되지 않는 방법의 제거.
임베디드 서버 :
XML의 이스케이프는이 잘못된 XML 문서를 일으킬 수, 수정되었습니다 반환 할
당신이 요청 큐의 최대 크기를 설정할 수 있습니다 새로운 설정 파일 옵션 'maxWorkQueueSize'-는이보다 큰 얻는 경우에, 요청이 거부됩니다 (503 서비스를 사용할 수 없음)
서버는 이제 이러한 오류 조건에보다 구체적인 HTTP 상태 코드로 응답 : 413 요청 엔티티가 너무 큼 - 검사가 최대 검사 시간을 초과하는 경우 - 텍스트가 최대 텍스트 크기를 사용할 수 없음 503 서비스를 초과하는 경우
GUI :
독립형 GUI는 이제이 파일은 시작 (Github에서의 문제점 # 232)에로드됩니다, 인수로 일반 텍스트 파일을 취할 수 있습니다.
명령 줄 :
이 명령 줄에서 LanguageTool를 호출 할 때 외부 규칙 파일을 추가 할 수있게되었습니다. 파일을 추가 --rulefile 사용합니다. 파일명은 언어의 이름을 포함하는 포맷을 갖는 경우, 다른 규칙과 함께 이용 될 것이다; 그렇지 않으면, 규칙을 대체 할 것이다. 또한 옵션 --falsefriends을 사용하여 거짓 친구와 함께 외부 파일을로드 할 수 있습니다. 파일 이름은 절대 파일 경로해야하고, 거짓 친구 파일은 항상 언어에로드 된 것들에 추가됩니다. (Github에서의 문제점 # 192)
구문 규칙 :
유일한 올바른 문장이 적용되는 보정 잘못된 문장과 같은 경우이 일부 중복을 저장할 수 있습니다 - 규칙은 현재로는, '보정'속성이 같은 단일 예문을 가질 수있다. 전에, 규칙은 적어도 두 개의 예문이 필요했습니다.
'예'요소 : '보정'속성이 있다면 유형 = "잘못된는"지금은 선택 사항입니다. '보정'속성은 문장이 잘못된 것을 의미한다.
'예'요소 : 유형 = "올바른"는 이제 선택 사항입니다. 없음 '유형'속성없이 '수정'속성은 문장이 올 것을 의미하지 않는다.
내부 :
우리는 자동으로 텍스트 언어를 식별하기위한 언어 검출기 (https://github.com/optimaize/language-detector) 아파치 티카로 전환했다. 그것은 빨리해야하고 결과는 더 신뢰할 수 있어야합니다. 아스 투리와 갈리시아어의 검출은 검출 품질이 낮아서 비활성화 또한 스페인어의 영향을 검출 할 수 있었다.
불가능 GUI에 외부 규칙 파일을로드하기 위해 만든 회귀가 수정되었습니다.
버전 2.8의 새로운 기능 :
아스 투리 아어 :
Hunspell에 제거 의존성, 지금은 맞춤법 검사에 대한 Morfologik를 사용
브르타뉴어 :
추가 및 몇 가지 규칙을 개선
카탈루냐어 :
업데이트 사전
추가 및 향상된 규칙
고정 잘못된 경보
네덜란드 :
추가 및 향상된 많은 규칙
영어 :
새로운 규칙 (닉 호우 덕분에)
문제 번호 (202)를 고정, 술래와 신디사이저 사전 업데이트
새로운 필터는 단어의 부품의 partofspeech, 예를 들어 일치에 사용되는 : 인치 *이 만 '에서'후 일부 형용사 (POS 태그 'JJ'이다 '에서'어디서 시작 단어 일치를 유지합니다 ). '더 : 1'최초로 유일한 일치가 부른다 즉 여기에, 토큰의 위치입니다.
프랑스어 :
추가 및 몇 가지 규칙을 개선
독일어
추가 및 몇 가지 규칙을 개선
폴란드어 :
추가 및 향상된 몇 가지 규칙
영어를 추가 및 개선 거짓 친구
포르투갈어
추가 / 개선 된 몇 가지 규칙
스페인어 :
Hunspell에 제거 의존성, 지금은 맞춤법 검사에 대한 Morfologik를 사용
포맷 규칙 파일
추가 이상의 규칙
타갈로그어 :
Hunspell에 제거 의존성, 지금은 맞춤법 검사에 대한 Morfologik를 사용
텍스트를 토큰화할 때 대시 문자 ( "")로 지금은 구분 기호를하다
러시아어 :
추가 및 향상된 규칙
추가 된 몇 가지 잘못된 친구 규칙 (러시아어 / 영어)
우크라이나어 :
많은 새로운 규칙 (명사와 계약을 포함하여, 시간 표현 등)
규칙의 적용 범위 개선
사전 업데이트 (고유 명사와 호격 경우에 대한 큰 개선)
새로운 태그와 규칙은 다른 철자에 대해 경고합니다
추가 단어 주파수 정보는 맞춤법 제안을 개선하기 위해
새로운 disambiguator 규칙
구문 규칙 :
... 이제 그룹의 모든 규칙에 영향을 rulegroup에 첨가 될 수있다
당신은 LT의 일부가 아닌 자신 만의 규칙을 개발하는 경우 지금 우리의 독립형 GUI에 나타나지 community.languagetool.org에 규칙 링크를 방지하기 위해 카테고리에 외부 = "예"를 추가 할 수 있습니다 (링크는 규칙 작동하지 않을 것입니다 그 LT의 주요 분포)의 일부가 아닙니다. (Github에서의 문제점 # 223)
규칙 그룹은 기본을 지정하는 경우 = / "OFF" "ON", 규칙 그룹 내부의 규칙도 = default를 지정하지 않을 수 있습니다 "OFF".
API :
2.7 이상부터 사용되지 않습니다되었다 제거 클래스와 메소드
임베디드 서버 :
설정 파일 옵션 'requestLimit'와 'requestLimitPeriodInSeconds가'이제 HTTP 서버에 사용할 수 있습니다 (다만 HTTPS 서버에 대한)
새로운 설정 파일 옵션 'trustXForwardForHeader': 당신은 역방향 프록시 뒤에 서버를 실행하고 요청 제한 'Xforwardedfor'HTTP 헤더가 제공하는 원래의 IP 주소에서 작업 할 경우 '사실'로 설정은 일반적으로 프록시 설정. 프록시 뒤에 실행하지만이 속성을 true로 설정하지 않으면 다른 사용자도 있기 때문에 요청 제한의 오류 메시지가 표시됩니다 있도록 한 사용자가 모든 요청을 사용할 수 있습니다.
후 마감 모드의 응답을 수정 ... 워드 프레스의 텍스트 검사를 혼란, 때로는 비어
이 서버에 대한 적절한 매개 변수로 지정된 경우에도 Bitext 규칙은 제대로 비활성화되지 않았다; 지금은 고정이야
일부 bitext 규칙에 대한 부적절한 위치에 조정 문제 (문제점 # 218)
GUI :
새로운 'errorColors'설정 languagetool.cfg 구성 파일에 추가되었다. 이는 오류의 배경색을 설정하는데 사용될 수있다. 예를 들어, errorColors = 인쇄상의 : # 1 b8b8ff는 스타일 : # 1 ffb8b8는 LT 윈도우의 상단에 빨간색 배경을 파란색 배경을 '오타'오류 및 '스타일'오류가 표시됩니다. '오타'과 '스타일' "유형 = ..."로 grammar.xml에 설정되어있는 유형입니다. 사용자 인터페이스는 이러한 색상을 구성하는 데 아직 없습니다. LT가 실행되지 않을 때 만 languagetool.cfg 파일을 편집해야합니다.
내부 :
버그 수정 : 같은 rulegroup에서 이전 규칙은 기본 = "OFF"를 사용하는 경우 규칙 그룹 내부 규칙이 활성화되지 않은
단어들은이 규칙의 제안에서 발생해서 맞춤법 검사기에 의해 더 이상 무시하지 않습니다. 당신은 맞춤법 검사기가 전 세계적으로 단어를 무시하려면, / ignore.txt을 hunspell에 추가합니다. 그들이 상황에 따라 무시하려면, disambiguation.xml하는 'ignore_spelling'규칙을 추가합니다.
맞춤법 검사기는 일반적으로 그들을 받아 들일 경우에도 파일 'hunspell / prohibit.txt는'지금 맞춤법 오류 등의 단어를 표시하는 데 사용할 수 있습니다. 이 업데이트 될 상류 검사를 기다리지 않고 LanguageTool 맞춤법 검사기를 개선하는 데 유용합니다. 'prohibit.txt'파일은 단어를 무시하도록 맞춤법 검사기의 원인 'ignore.txt'의 반대입니다.
대부분의 언어에 대한 partofspeech 술래는 지금 (XX는 언어 코드 인) 파일 조직 / languagetool / 자원 / XX / added.txt에 항목을 추가하여 확장 할 수 있습니다. 형식은 "fullform의 baseform의 postag", 탭으로 구분 된 세 개의 열이 있습니다. 이것은 그들이, 수출, 수정 및 모든 변경에 대한 이진 사전을 다시 만들 필요가 없기 때문에 쉽게 사용자 (개발자)의 경우, 포스 술래를 확장 할 수 있습니다.
버전 2.7의 새로운 기능 :
브르타뉴어 :
추가 및 향상된 규칙
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 그 날은 금요일 아니므로 "Gwener (28) 즉의 Eost 2014", 감지합니다.
카탈루냐어 :
추가 및 향상된 규칙
고정 잘못된 경보
네덜란드 :
추가 및 향상된 많은 규칙
Morfologik 기반 맞춤법 검사기로 전환
- 영어 :
당신은 세계에서 가장 강력한 오픈 소스 교정 도구를 개발하는 팀의 일원이되고 싶어? 우리는 LanguageTool에서 영어 규칙에 대한 메인테이너를 찾고 있습니다. 자세한 내용은 http://wiki.languagetool.org/tasks-for-language-maintainers를 참조하십시오.
모든 영어 사전은 맞춤법 검사기 제안을 개선하기 위해 단어 주파수 클래스를 포함하도록 확장되었습니다 (주파수 데이터는 https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js/imes/에서 가져온 것입니다 라틴어 / 사전, 이미이 기능을 사용하여 다른 언어로).
영어 학습자를위한 더 나은 제안 : 불규칙 동사, 명사, 형용사는 이제 일반적으로 더 나은 제안이. 예를 들어, 제안 'thinked' '생각', '여자는'여성 '을 시사한다.
더 많은 맞춤법 오류는 지금, 예를 들면 제안을 제공합니다 'garentee'(보장), 'greatful'(감사합니다). 이것은 (알 수없는 단어의 많은 텍스트에 대한 이상) ~ 10 %의 성능 저하의 원인이 될 수 있습니다.
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 그 날짜가 월요일 아니므로 "2014년 10월 7일 (월요일)는"감지합니다. 이 사용 날짜 형식을 감지 한 경우이 규칙에만 작동합니다. 지금까지 이러한 형식이 지원됩니다 : * "2014년 10월 7일 (월요일)"* "2014년 10월 7일 (월요일)은"* "10월 7일 (월요일)는 2014 년"* "2014년 10월 7일 (월요일)"* (이 또한 단축 주와 함께 작동 월요일 모 또는 월과 같은 일)
에스페란토 :
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 그 날은 금요일 아니므로, "Vendredon 라 28 드 AAgusto 2014"을 검색합니다.
프랑스어 :
업데이트 POS 태그 사전 및 Hunspell 사전 Dicollecte-5.2하기
신디사이저를 추가 - 계약 규칙이 지금 어떤 오류에 대한 제안을 할 수 있습니다
추가 / 개선 된 몇 가지 규칙
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 그 날은 금요일 아니므로, "VENDREDI 28/08/2014"감지합니다.
독일어
희귀 NullPointerException이하고는, ArrayIndexOutOfBoundsException가 수정
고정 몇 가지 잘못된 경보
추가 및 향상된 규칙
(인해 잘못된 경보의 위험에 기본적으로 꺼져) 동사없이 문장을 검사 새 규칙
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 그 날은 화요일 아니므로 "Dienstag, 2014년 9월 29일는"감지합니다.
맞춤법 검사 제안에 대한 성능 개선
페르시아어 :
페르시아어 (이란어)에 대한 초기 지원 추가
폴란드어 :
추가 및 몇 가지 규칙 개선
평일 날짜를 일치하는 경우 확인 새 규칙
포르투갈어
추가 / 개선 된 몇 가지 규칙
복합 단어의 추가 많은 수십
러시아어 :
추가 된 새로운 규칙
소스 포지 기능 요청 번호 (38)를 고정 (다른 인용 부호를 확인)
추가 된 몇 가지 잘못된 친구 규칙 (러시아어 / 영어)
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, 검출 "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & 마이크로; & ETH; & frac12; N & sbquo; N ?? & ETH, & plusmn; N & 유로; N ?? 2014 & ETH; & sup3는 ;. "해당 날짜는 월요일 아니므로.
postag 사전에서 새로운 단어로 확장 러시아어 화합물 규칙
스페인어 :
추가 된 새로운 POS 카테고리 Z (철자 숫자, 예를 들어 '우노', '도스', ...)
철자 숫자는 지금 감지 모호성과 규칙을 모두 관리 할 수 있습니다.
POS 사전에 일부 잘못된 표제어가 수정되었습니다.
하이브리드 chunker-disambiguator을 추가했습니다.
타밀어 :
타밀어에 대한 초기 지원 추가. https://bugs.openjdk.java.net/browse/JDK-8008572 : 타밀어의 글꼴이 제대로 컴퓨터에 표시되지 않고 Windows를 사용하는 경우, 당신은 일이 여기에 설명 적용해야 할 수도 있습니다
우크라이나어 :
POS 사전에 대한 큰 업데이트 (수정 및 새로운 단어)
일관성을 위해 이름 일부 POS 태그; 약어 및 희귀 단어에 대한 새로운 태그
기존 규칙에 대한 많은 새로운 규칙 및 수정
평일 날짜를 일치하는 경우 확인 새 규칙, 예를 들어, "; & ETH; & frac34; & ETH; & frac12; & ETH; & 마이크로; & ETH, 'N- 및 ETH; & ETH"& ETH를, 감지 및 frac34; & ETH; & ordm ;, 7 ETH; & 파라; & ETH; & frac34; & ETH; & sup2; 2014 ", 그 날짜가 월요일 아니므로
토큰 정규화 성능 향상
리브레 오피스 통합 :
리브레 오피스 4.3 각주에 의해 혼동 이상 (지금은 메타 데이터와 각주 위치를 우리에게 제공, 그래서 우리는 그들을 무시할 수)하지 마십시오.
API :
주요 JLanguageTool이 스레드마다 작성되는 멀티 스레드 사용 사례에 대한 성능 향상,하지만 언어의 객체 (예를 들어 '독일어') 한 번만 생성됩니다. 생성 JLanguageTool에 대한 오버 헤드가 훨씬 낮아야한다.
버전 2.6부터 사용되지 않습니다되었다 제거 몇 가지 클래스와 메소드
제거 DutchSpellerRule는 - 대신 MorfologikDutchSpellerRule를 사용
Language.getRelevantRules의 서명은 () 변경
JLanguageTool과 MultiThreadedJLanguageTool 생성자는 더 이상 IOException를 던져 선언하지
WhitespaceRule가 MultipleWhitespaceRule로 이름이 변경되었습니다 (WhitespaceRule이 여전히 존재하지만 사용되지 않습니다)
누구의 가시성 (예를 들어 대중의 보호에) 감소됩니다되지 않는 몇 가지 방법
MorfologikSpellerRule.getRuleMatch (문자열, INT)가 MorfologikSpellerRule.getRuleMatches로 이름이 변경되었습니다 (문자열, INT)
toPosition가 fromPosition보다 큰 경우 RuleMatch 생성자는 이제 예외가 발생합니다
규칙을 확장하고는 하나의 문장 이상을 포함 규칙에 사용할 수있는 새로운 추상 클래스 TextLevelRule을 소개했다.
명령 행 :
활성화와 동시에 특정 규칙을 해제하는 것이 이제 허용된다. 단지 이전에 "--enable LIST_OF_RULES"로 이루어졌다 (나머지는 모두 해제) 몇 가지 규칙을 테스트하기 위해, 지금 "--enabledonly --enable LIST_OF_RULES를"(또는 "-eo -e LIST_OF_RULES")를 사용합니다.
임베디드 서버 :
두 개의 새로운 옵션이 마감 (ATD) 후와 같은 XML 형식을 반환 LanguageTool하기 위해 파일 속성을 설정할 수 있습니다. 이 드롭 인 (drop-in) 교체 ATD를위한로 사용할 수 있습니다이 방법 : * 모드 - 모드 'AfterTheDeadline'참고로 설정되어있는 경우 기본 언어의 코드 - 'LanguageTool'또는 'AfterTheDeadline는'afterTheDeadlineLanguage는 * 'AfterTheDeadline'모드가 고려되어야한다 지금은 실험.
새로운 옵션 'maxCheckThreads는'병렬 요청 작업 스레드의 최대 수를 설정 허용한다. 예전과 같이 기본값은 10입니다.
내부 :
요일과 날짜가 일치하면 확인할 수 있습니다 새로운 추상 규칙 AbstractDateCheckFilter. 예를 들어 "2014년 9월 29일 (화요일)은"9 월 29로, 2014 년 실제로하지 않은 화요일 검출 할 수있다. 이 새로운 '필터'요소와 XML에서 호출 할 수있는 새로운 실험 RuleFilter 인터페이스를 사용합니다. '클래스': RuleFilter를 구현하는 자바 클래스의 완전한 이름, 예를 들어 '필터'는 이러한 특성을합니다 "org.languagetool.rules.de.DateCheckFilter" '인수'와 같은 문자열 "년 1 월 : 이일 : 3 평일 : 4", 키 / 값 쌍의 예를 공백으로 구분 된 목록, X가에 해결됩니다 ( '메시지'요소에서와 같이) 패턴의 토큰 값
복합 규칙은 이제 disambiguation.xml에 예방 접종을 한 토큰을 무시
disambiguator에서 "필터"작업은 이제 주어진 POS 태그를 일치 POS 태그에 적용됩니다. 일치하지 않으면, 규칙은 적용되지 않는다.
http://wiki.languagetool.org/tips-and-tricks#toc2에 설명 된대로 XML 규칙을 확장하는 경우, 외부 규칙과 동음이 파일은 지금과 같은 URL을 지정하여 암호로 보호 된 서버에서 호스팅 할 수 있습니다 이 : HTTP : // 사용자 : password@example.org/path/user-rules.xml
전각 대시 ( "& 유로는," ") 이제 모든 언어에 대한 토큰 문자입니다
새로운 기능 :
언어 모델을 사용하여
LanguageTool 해주기 Ngram의 데이터를 사용할 수있다. Ngram의 데이터는 문구는 언어에서 발생하는 빈도에 대한 정보입니다. 현재,이 길이 3의 문구를 사용합니다.
데이터는 거친 / 코스 나 감각 / 플레어를 혼합 같은 동음 오류를 찾기 위해 영어 규칙에 의해 사용된다. LanguageTool 전에 이런 종류의 몇 가지 규칙이 있었다, 그러나 새로운 규칙은 현재 약 900 워드 쌍 / 세트를 지원합니다.
이 필요한 데이터는 일부 또는 LanguageTool 따라서 (영어 7기가바이트) 거대하고 없습니다.
데이터 (영어 만 지금은) 더 많은 문서는 http://wiki.languagetool.org/finding-errors-using-big-data에서 확인할 수있다
데이터가 SSD에 저장 될 때 ngrams를 사용하면 LanguageTool 약간 느린 있습니다.
SSD에 저장되지 않은 경우, 성능이 크게 저하 될.
데이터를 사용 규칙을 활성화하기 위해 명령 행 클라이언트와 새로운 --languagemodel 옵션을 사용합니다. 이 옵션은 아직 독립 실행 형 GUI를 사용할 수 없습니다.
버전 2.4.1의 새로운 기능 :
1.8.3로 업데이트 Morfologik 라이브러리는 적어도 EN-US 영향 맞춤법 검사기에 느린 제안을 해결하기 위해
버전 2.4의 새로운 기능 :
브르타뉴어 :
SRX 문장 토큰 화
추가 / 몇 가지 규칙을 개선
일부 잘못된 경보를 고정
수정에 대한 추가 시험을 잘못 제안 덕분에 고정
카탈루냐어 :
추가 / 개선 된 몇 가지 규칙
고정 잘못된 경보
술래 사전에 만든 추가 및 수정
합성 사전에서 일부 단어를 제거 (filterarchaic.txt 참조)
술래 사전에 주파수 데이터를 추가; 주파수 단어 목록은 아파치 라이선스 버전 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)로, 가이아 프로젝트에서 비롯됩니다.
영어 :
추가 / 몇 가지 규칙을 개선
일부 잘못된 경보를 고정
프랑스어 :
추가 / 개선 된 몇 가지 규칙
일부 잘못된 경보를 고정
독일어
추가 / 개선 된 몇 가지 규칙
신디사이저를 추가 해주기 때문에 약간의 오차 (모든 제안,하지만 정확)에 대한 제안을 할 수있는 계약 규칙
폴란드어 :
특히 하이픈과 대시 사용을위한 추가 / 개선 된 몇 가지 규칙,
맞춤법 검사 사전에 추가 주파수 정보; 주파수 단어 목록은 아파치 라이선스 버전 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)로, 가이아 프로젝트에서 비롯됩니다.
일부 잘못된 경보를 고정
포르투갈어
/ 개선 된 몇 가지 규칙을 추가 (지금 성 규칙 ""/ "O"를 포함한다)
지금 3400+ 복합 단어를 가지고
이전에이 상황에서 무엇을 의미하는지 '독립'에 대한 혼란 (GitHub의 문제 번호 29)을 피하기 위해 languagetoolstandalone.jar에서 jar 파일은, languagetool.jar 이름이 바뀌 었습니다
긴 텍스트의 성능 (프랑스어 또는 독일어 등) 많은 규칙과 언어에 대해 2030 % 증가하고있다
(MultiWordChunker에 중단을 일으킬 수) threadsafety에 대한 수정
청크 주석 그룹에서 테스트되지 않은 버그 수정
수정 : 1, 평가되지 않은 ...
중간에 일치하는 해석의 일부를 폐기 통일기구의 버그를 수정
disambiguator에서 청크 주석에 대한 지원을 추가, 및 청크 주석 필터링 토큰 하나의 버그를 수정
1.8.2로 업데이트 Morfologik 라이브러리 (버그 수정, 확인 엄격한 입력 정신, 사전에 주파수 데이터를 추가)
taggging 또는 맞춤법 사전에 주파수 데이터를 포함하는 옵션을 추가했습니다. 주파수 단어 목록의 예상 형식은 아파치 라이선스로, 가이아 프로젝트의 하나이며, 버전 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
수출 및 바이너리 사전을 만들 수있는 새로운 명령 줄 도구 :
org.languagetool.dev.DictionaryExporter
org.languagetool.dev.POSDictionaryBuilder
리브레 오피스 / 오픈 오피스 통합 :
각주가 문장 전체 정지 후 나타난 경우에 대한 잘못된 문장 검출 (소스 포지 버그 # 191)에 대한 해결 방법을 추가
독립형 GUI :
오류의 컨텍스트 메뉴에서 "추가 ..."항목에 의해 열린 대화는 이제 정확하고 잘못된 예문을 표시합니다
API :
SentenceTokenizer는 구현 RegexSentenceTokenizer로 이동되었습니다,하지만이되지 않으며 SRXSentenceTokenizer 대신 사용해야합니다, 지금 인터페이스
org.languagetool.tools.StringTools에서 어떤 방법이 languagetoolguicommons 프로젝트의 org.languagetool.gui.Tools 클래스로 이동되었습니다
LanguageToolListener.languageToolEventOccured () LanguageToolListener.languageToolEventOccurred로 이름이 바뀌 었습니다 ()
org.languagetool.tools.SymbolLocator 더 이상 공개하지 않습니다 (사람에 영향을 미치지 않습니다)
3 년 동안 사용되지 있었다 제거 DanishSentenceTokenizer
Rule.getCorrectExamples ()와 Rule.getIncorrectExamples () 아니오 예이없는 경우 더 이상 null을 반환하지만, 빈리스트가 없습니다. 따라서, setCorrectExamples ()와 setIncorrectExamples ()는 더 이상 널 (null) 허용하지 않습니다.
Rule.getId ()는 현재 모든 문자열을 반환 할 수 있습니다뿐만 아니라 ASCIIonly 문자열 (ASCIIonly 제한이 적용되지 만의 javadoc에서 언급 한 적이되었을 때 실제로는, 이전의 경우되었습니다)
languagetoolwikipedia : 위키 백과 덤프를 확인하기위한 명령 줄 옵션이 단순화되었다. 이 명령은 지금과 같이 호출 할 수 있습니다 자바 항아리 languagetoolwikipedia.jar checkdata 리터 엉 F enwiki20130621pagesarticles.xml 사용 메시지가 단지 "자바 항아리 languagetoolwikipedia.jar의 checkdata"를 호출합니다. 하나 이상의 파일이 F 옵션으로 지정 될 수 있습니다. 또한 위키 백과 XML 덤프로, Tatoeba에서 CSV 파일 (http://tatoeba.org) 이제 지원됩니다, 그들은 단지 관련 언어를 포함 할 첫 번째 필터링 할 필요가있다.
2.3 버전의 새로운 기능 :
브르타뉴어 :
추가 / 몇 가지 규칙을 개선
고정 잘못된 경보
Apertium에서 업데이트 된 POS 사전 (SVN r47282)
카탈루냐어 :
언어 코드 CA-ES-발렌시아 (카탈로니아 발렌시아)에 대한 지원을 추가, 리브레 오피스 4.2.0에 사용되는
대체 제안의 수백 간단한 대체 규칙을 추가
추가 / 개선 된 몇 가지 규칙
고정 잘못된 경보
중국어 :
StringIndexOutOfBoundsException를위한 해결 방법을 추가 (http://sourceforge.net/p/languagetool/bugs/186/)
영어 :
맞춤법 검사기에 대한 추가 교체 패턴 (현재 'teached'에 대한 '가르침'이벤트) 제안을 더 만들려면
추가 / 몇 가지 규칙을 개선
프랑스어 :
추가 / 몇 가지 규칙을 개선
고정 잘못된 경보
업데이트 POS 태그 사전 및 Hunspell 사전 Dicollecte-4.12을합니다
독일어
추가 / 개선 된 몇 가지 규칙
포르투갈어
추가 / 몇 가지 규칙을 개선
지금 3300+ 복합 단어를 가지고
우크라이나어 :
추가 / 개선 된 몇 가지 규칙
소스 코드는 GitHub의 이동되었습니다 : https://github.com/languagetool-org/languagetool
LanguageTool 이제 자바 7이 필요합니다
LanguageTool 텍스트는 성능을 향상, 최신 하드웨어에 확인하기 위해 현재 여러 개의 스레드를 사용한다 (이것은 독립 실행 형 버전, 명령 행 버전과 리브레 오피스 / 오픈 오피스 확장에 영향을 미치는)
구문 규칙 :
시간의 주어진 숫자를 표시하는 요소를 일치시킬 수 있습니다 새로운 최소 / 최대 속성의 예비 지원. 예를 들어 foo는 즉 아무것도 또는 "foo는"일치하지 않습니다 "푸"옵션 foo는이 "foo는"또는 "foo는 foo는"아무것도 일치하지 않습니다 foo는 "foo는"또는 "foo는 foo는"사용 최대 = 일치하는 것입니다 "- 1" 무제한 발생을 허용합니다. 분, 만 0 또는 1 (1 기본값) 지원됩니다.
또는 명령문에 대한 지원. 예를 들어 : 내부 및 런타임에서, 또는 명령문을 포함하는 규칙 또는 명령문이없는 몇 가지 규칙으로 변환된다.
영어는 이제 다른 사람, 단수와 복수 명사 덩어리 사이에 감지 할 수있는 chunker 있습니다. 이것은 http://wiki.languagetool.org/using-chunks에 설명되어 있습니다
독립 실행 형 버전 :
독립 실행 형 버전은 지금 빨간 오류 (맞춤법 오류) 또는 파란색 (기타 오류) 라인을 강조한다 (PANAGIOTIS 미노스)
다음 시작을위한 언어 선택 기억
다중 모니터 설정에서 개선 된 창 및 대화 배치
임베디드 서버 : 인수없이 시작하면 다시 기본 포트 (8081)를 사용
업데이트 morfologik-에 따른 발음 구별 부호 및 교체 패턴의 적절한 처리를 포함하여 더 나은 제안을 활성화하기 위해 버전 1.7.1에 도서관을 (hunspell 사전에 MAP 및 REP 기능 당량)
오픈 오피스 / 리브레 오피스 통합 :
FIX : "정보"대화 상자가 아파치 오픈 오피스 4.0에서 작동하지 않았다
수정 : 국가 별 규칙이 작동하지 않았다 (영국 영어 등)
API :
수준의 언어로, getCountryVariants은 () getCountries ()로 이름이 변경되었으며, 새로운 방법의 getVariant이 추가되었습니다.
어떤 방법이 사용되지 않습니다
몇 가지 방법은 새로운 CommandLineTools 클래스 (languagetool-명령 줄)에 도구 클래스 (languagetool 코어)에서 이동 된
AbstractRuleDisambiguator는 XmlRuleDisambiguator 이름을 변경하고 더 이상 추상적 아니다되었습니다. RuleDisambiguator 클래스가 제거 된, XmlRuleDisambiguator 직접 대신 사용될 수있다.
새로운 방법 JLanguageTool.check (AnnotatedText)는 마크 업 텍스트를 확인할 수 있습니다이 도입되었습니다. 입력을 구축 AnnotatedTextBuilder를 사용합니다.
스레드 안전성이 향상되었습니다. 권장 사용 사례는 각 스레드에 대한 새로운 JLanguageTool 개체를 만들 수 있지만 한 번 언어를 만들기 위해 지금 (예를 들어 새로운 영어 ())과 모든 JLanguageTool 인스턴스에 대한 것을 사용합니다. 이것은 일부 공공 클래스의 API를 변경,하지만 JLanguageTool와 텍스트를 확인하는 표준 유스 케이스 것이 차이가 안 객체. (스테판 Lotties에 의해 패치)
JLanguageTool.loadFalseFriendRules ()는 현재 JLanguageTool.loadPatternRules ()처럼 동작 : 지정된 파일이 발견되지 않는 경우는 파일 시스템에서, 먼저 클래스 경로에서보고,
토큰 (또한 문구라고도 함) 청크를 할당 할 수 있습니다 Chunker 인터페이스를 도입했다. 예를 들어, "빠른 컴퓨터"와 같은 명사 구문을 chunker는 문구에서 토큰 각각 'NP-단수'(명사구, 단수) 덩어리를 할당 할 수 있습니다. grammar.xml, 이러한 토큰은 다음 구문과 일치 될 수있다 :
컴퓨터 프로세서가 같이 새로운 클래스 MultiThreadedJLanguageTool은 많은 스레드를 사용합니다. 우리의 테스트에서이 30킬로바이트 텍스트에 사용하는 경우 인텔 i7 프로세서에 약 70 %의 시간을 확인하는 텍스트를 개선했다.
이 foreach는 루프에서 사용할 수 있도록 AnalyzedTokenReadings 지금의 Iterable을 구현
AnalyzedGermanTokenReadings가 제거 된, AnalyzedTokenReadings 대신 사용될 수있다
내장 HTTP 서버 : 서버는 이제 10 스레드 대신 1 (PANAGIOTIS 미노스에게 감사)를 사용
위키 백과 덤프에서 텍스트 추출이 향상되었습니다
2.2 버전의 새로운 기능 :
많은 오류 검출 규칙은 특히 프랑스어, 독일어, 카탈루냐어, 포르투갈어, 러시아어, 에스페란토, 및 브르타뉴어에 대한 업데이트되었습니다.
몇 가지 작은 버그가 수정되었습니다.
버전 2.1의 새로운 기능 :
이 버전은 영어, 프랑스어, 독일어, 포르투갈어, 카탈루냐어, 폴란드어, 러시아어, 브레튼, 에스페란토, 이탈리아에 대한 오류 검출 규칙에 대한 많은 업데이트를 추가합니다.
LanguageTool는 자바 개발자가 쉽게 사용할 수 있도록, 지금 모듈입니다.
대신에 하나의 큰 항아리의 여러 작은 것 (곧 메이븐 중앙에서 찾을 수)는 이제이 있습니다.
몇 가지 오류가 수정되었습니다.
버전 2.0의 새로운 기능 :
영어, 스페인어, 프랑스어, 독일어, 포르투갈어, 러시아어, 브레튼, 카탈로니아 어, 에스페란토, 우크라이나어에 대한 오류 검출 규칙에 대한 많은 업데이트가 추가되었습니다.
LanguageTool 시스템 트레이에서 실행중인 경우 내장 된 HTTP 서버는 지금 상황에 맞는 메뉴에서 시작할 수 있습니다.
일부 작은 버그가 수정되었습니다.
버전 1.9의 새로운 기능 :
많은 새로운 오류 검출 규칙이 추가되어 기존의 룰이 업데이트되었다.
요구 사항 :
자바 2 스탠다드 에디션 런타임 환경
댓글을 찾을 수 없습니다