pdf파일 통번역하는 세 가지 팁

디노입니다. 최근 태블로 컨퍼런스 PDF자료들을 살펴보다가 일반 웹페이지 처럼 레이아웃은 그대로 둔 채로 텍스트만 영문으로 변환해주면 얼마나 편리할까 하는 생각이 들었습니다.

다행히도 PDF파일을 여러 언어로 번역해주는 서비스가 있습니다. 아래의 세가지 인데요 한 개씩 자세하게 살펴봅니다.

  • 구글 번역
  • 구글 문서
  • Doc Translator


1. 구글 번역기로 pdf 번역하기

구글 번역기는 많이들 쓰시지요? 요즘 파파고를 더 많이 쓴다는 사람도 많이 있습니다만, 웹 번역기의 원조는 역시 구글입니다. 그런데 구글 번역기로 pdf를 번역할 때 어떻게 하셨나요? 저는 문장을 복사해서 번역창 안에 넣고 번여고딘 한글을 읽어 이해하고는 했었습니다. 아래 그림 처럼 말이죠..

그런데 아래그림을 보면 붉은 박스 안에 문서라는 버튼이 보이시나요? 이것이 바로 문서를 위한 번역 기능입니다. 이 버튼을 최근에서야 다른 블로그를 읽다가 발견했습니다.

문서를 선택하고 번역을 누르게 되면 아래와 같이 번역이 되어 텍스트가 보여집니다. 많이들 느끼는 것이겠지만 번역이 완벽하지 않은 것은 감안해야할 것이고요, 또 pdf 문서 내의 문장을 번역할 때 마다 느끼는 것은 편집상의 문제인지 줄바꿈이 제멋대로여서 문장의 중간에서 줄바꿈이 되기도 하여 이상한 번역이 되기도 합니다. 그럼에도 불구하고 모국어로 전체적인 맥락을 이해하는데는 문제가 없는 수준이 된 것을 느낍니다.


2. 구글 문서로 pdf 번역하기

구글 문서는 구글의 웹WORD로 많이들 알고 계시지요. 구글 문서의 문서 인식기능(이미지를 문장으로 인식해주는 기능)이나 번역 기능도 훌륭합니다. PDF문서를 드라이브에 올린다음 우클릭을 하여 Golgle 문서로 열기를 선택해 줍니다.



아래 그림을 보면 문서를 제대로 읽어온 것을 볼 수 있습니다. pdf가 레이아웃을 복잡하게 잡은 경우에는 전체 레이아웃이 살짝 깨지는 수가 있습니다.

아래 그림처럼 도구-문서 번역을 눌러서 번역을 합니다.

한국어 혹은 번역을 원하는 언어를 선택합니다. 100개 이상의 언어를 지원한다고 하니 구글의 대단함을 엿볼 수 있습니다. 당연히 일본어 문서를 한글로 변환한다던가 하는 것도 문제 없어 보입니다. 문서 번역결과 아래 그림과 같이 한글로 번역된 문서가 사본으로 생성되었습니다.


3. DocTranslator 서비스를 이용하는 법

위의 두가지 방법은 번역은 구글의 번역기를 사용하는 것이므로 상당히 높은 수준이라 기대를 할 수 있지만 레이아웃을 어느정도 포기해야 가능한 부분도 있습니다.

웹서핑을 하다보니 DocTranslator 라는 서비스가 보여서 사용해 보았습니다. 문서의 글자만 번역해서 치환해주기 때문에 레이아웃을 그대로 유지 할 수 있기 때문에 상당히 의미가 있지 않나 합니다.

Doc Translator Logo
Doc Translator PDF

문서의 레이아웃은 유지하면서 109개 (현재 시점) 언어를 지원한다고 하고 설치나 가입이 필요 없습니다.

상단의 [PDF를 워드로 변환하기]를 눌러서 번역을 해보겠습니다.

파일을 업로드하고 하단에 언어 설정을 하면 번역이 시작됩니다. 계속해서 빈 공간에 광고가 계속 뜨는 것을 보면 비즈니스 모델을 광고 수입으로 잡은 듯도 합니다.

번역 안내창에 보면 POWERED BY GOOGLE TRANSLATE로고를 보면 번역은 GOOGLE Translate api를 활용하여 구글에서 하는 것으로 추정됩니다.

위의 그림을 보시면 광고로 도배되어 정신은 없습니다만, [PDF를 워드로 변환하기] 버튼 아래에 [번역된 문서를 다운로드 받으세요] 링크가 보이는데 이 파일을 다운받아서 열어보면 아래와 같이 레이아웃은 유지한 채로 문장 부분에 번역된 문장으로 치환되어 있는 것을 볼 수 있습니다.

샘플로 적당한 문서를 찾다보니 문서가 좀 단순하게 보입니다만, 레이아웃이 상당히 복잡한 문서도 레이아웃을 유지한 채로 상당히 잘 번역하여 문서를 얻을 수 있습니다. 당연히 인쇄 등의 문제에서 자유롭겠지요.

이렇게 만들어진 문제는 해당 사이트의 PDF를 WORD로 변환/편집하기 등의 기능을 활용하여 번역된 문장을 다듬는 다던가 혹은 혹시라도 깨진 레이아웃을 정렬하는 등의 방식으로 마무리할 수 있지 않을까 합니다.

또 글을 쓰기 위해서 이것 저것 사용하다보니 PDF쪼개기 기능도 있네요. 100여장의 PDF중에서 10~20페이지만 번역이 필요한 경우 100여장을 번역하기보다는 10~20페이지만 별도의 문서로 저장한 다음 이것을 번역하는 것도 시간대비 효율적이지 않을까 합니다.

마무리

PDF 문서를 통째로 번역하는 방법을 살펴보았습니다. 저 개인적으로는 DocTranslator 서비스 상당히 유용해보였습니다. 최근의 좋은 툴 많이 사용해서 업무에 도움이 되시기를 바랍니다.

 15,664 total views,  6 views today

gsuite 이메일 서버 보안 강화하기

안녕하세요. 디노입니다.

저희 회사는 구글 지스윗을 사용하고 있어서 설정할 때 크게 설정할 일이 없습니다만, 최근 여러 문의를 통해서 이메일 보안을 강화하기 위해 추가 설정할 내용이 있는 것을 파악하고 이 내용을 공유합니다.

아래의 세 개의 설정을 추가해줘야 한다는데 설명은 다음과 같고 설정 방법을 설명드립니다.

SPF (Sender Policy Framework) 는 도메인의 이메일을 보낼 수 있는 서버를 지정합니다.
DKIM(DomainKeys Identified Mail) 은 메일 콘텐츠가 위조되지 않았고 변경되지 않았는지 확인합니다.
DMARC(Domain-based Message Authentication, Reporting & Conformance) 는 도메인에서 의심스러운 수신 이메일을 처리하는 방법을 지정합니다.


1. SPF레코드

SPF레코드 관리는 다음 문서를 참조하세요. https://support.google.com/a/answer/33786?hl=ko

저희 고객사에서는 이 설정이 되어 있지 않아서 몇개의 기관에서 메일이 리턴되어 오는 경우가 있었습니다.

DNS서버의 TXT설정을 점검하여 레코드가 기존에 존재한다면 삭제하고 다음 값을 이용하여 TXT레코드를 만듭니다.

  1. 이름은 @를 입력하거나 빈칸
  2. TTL 3600으로 하거나 노터치
  3. 값/응답/대상은 v=spf1 include:_spf.google.com ~all
저희 회사의 설정 화면 (domain.com을 각자 도메인으로 변경하세요)

2. DKIM 설정 – 위장 방지

DKIM관리는 다음 문서를 참조하세요.
https://support.google.com/a/answer/174124

구글 관리콘솔 > G Suite > Gmail > 이메일 인증 > 새레코드 생성 으로 이동

이메일 인증 메뉴로 들어가면 아래와 같이 DKIM 설정 화면이 뜹니다.

이 값을 복사하여 DNS 서버로 들어가서 새 레코드 생성하여 TXT레코드에 저장합니다. 각 DNS 설정 서버의 설정 방법에 따라 달라질겁니다. 참고로 저희 회사는 dnsever.com 이라는cloud dns서비스를 사용하고 있습니다.

저희 회사 샘플입니다. 관리 콘솔에 나온 내용을 그대로 txt레코드로 저장합니다.

3. DMARC 사용 – 의심스러운 이메일 처리

DMARC 관리는 다음 문서를 참조하세요.
https://support.google.com/a/answer/2466563?hl=ko

txt레코드에 _dmarc.mydomain.com 과 같이 _dmarc 를 입력하고 txt의 내용에 다음 셋 중 하나를 적용합니다.

v=DMARC1; p=none; rua=mailto:admin@mydomain.com

저희 회사 설정 샘플입니다.

99. 요약

세 가지 요소를 설정하여 다음과 같이 DNS 서버가 설정되면 됩니다.

 800 total views,  3 views today

다른 구글스프레스 시트의 내용 참조 (import range)

디노입니다. 구글 스프레드시트는 다른 시트를 참조할 수도 있습니다. 다음과 같은 형식입니다. vlookup과 유사한 기능입니다.

=importrange(“1LDaZf4mGONVS3ruFg000000n9WgBPSYbMHJYhDMA”, “A:P”)

첫 번째 인자는 문서의 고유 번호입니다. 아래 그림대로 참고하고자 하는 문서의 URL의 붉은 부분을 더블클릭하시면 선택되고 두번째 인자는 행의 범위입니다.

스프레드시트의 고유 ID

이를 잘 활용하면 여러 문서 간에 잘 연결이 되는 살아 있는 문서를 만들 수 있습니다. 자세한 내용은 아래 구글 문서 링크를 참조하세요.

https://support.google.com/docs/answer/3093340?hl=ko

 486 total views,  4 views today

메일 원문 분석하기

메일에 이상이 있지 않나 싶을 때, 메일의 원문을 검사해야만 하는 경우가 있습니다. 메일 원문은 메일 텍스트 뿐만 아니라 여러가지 정보가 같이 들어있기 때문에 이것을 분석하면 됩니다. 저희는 구글의 지스윗을 사용하기 때문에 이 경우를 예를 들어 설명드립니다.

원문 보기 메뉴의 위치

개별 메일에서 [메뉴]를 선택하고 [원문 보기]를 선택하면 팝업창이 열리고 아래와 같은 화면이 나타납니다. 여기에서 왼쪽의 [원본 메일 다운로드]를 선택해서 파일을 다운받거나 혹은 [클립보드로 복사]를 선택해서 내용을 복사해서 메일에 넣거나 할 수 있습니다. [원본 메일 다운로드]를 하면 .eml형식의 파일이 떨어지는데 이것은 이메일의 표준 형식 파일입니다.

이제 이 메일 헤더의 내용을 분석해야 하는데 다음의 링크에 분석 방법이 설명되어 있습니다. https://support.google.com/mail/answer/29436?hl=ko

요지는 GSuite Toolbox 의 메시지헤더라는 메뉴가 있는데 이 곳에서 메일 메시지를 붙여 넣으면 메일이 어떤 중계 서버등을 통해서 내게 도착하게 되었는지 등의 여러가지 정보가 들어 있는 메시지 헤더를 분석할 수 있습니다.

메일 원문을 클립보드로 복사하여 붙여 넣으면 아래와 같이 분석을 해주네요.

이런 방식으로 분석 내용을 한 번 확인해보시기 바랍니다. 많은 경우 사용하고 있는 회사의 많은 사람에게 동일한 오류가 나타나는 것이 아니라면 특이한 몇 몇 메일의 발송 메일 서버를 의심해야 하는 경우가 많습니다.

감사합니다.

 888 total views,  3 views today