Windows でローマ字転写されたサンスクリット文字を入力する

はじめに

Windows・Mac・Linux 間のやり取りでしばしばユーザーを悩ますのは文字コードの問題で、Mac ユーザーからもらったファイルが文字化けして読めない、なんていう悩みは Web 上にごまんとある。しかし、最近では Windows でも UTF-8 ベースとなってきて、ファイル名など一部 UTF-8 では不便する場面もあるが、一頃に比べれば随分と文字コードの悩みは減ったのではないかと思う。

Continue reading

インド学仏教学における LyX の利用

はじめに

LyX を使ってみたが、大変素晴らしい。LyX はバックエンドに LaTeX を使用しているが、表上は LaTeX の構文を意識する必要がない。視覚的に書く内容だけに集中できるので、よりスムーズに文書を作成することができ、LaTeX にある程度習熟したユーザーであっても、その恩恵に浴するところは大きい。ここでは、LyX を利用してインド学仏教学の論文を作成するためのノウハウを書いて見ることにする。といっても、私自身もつい数日前に LyX を使用しはじめたばかりなので、設定や操作方法は手探り状態である。自分用のメモも兼ねてここにいくらか残しておこうと思う。

Continue reading

NTEmacs で UTF-8 な環境構築を試行錯誤

Winodws 7 で Cygwin + NTEmacs 事始め の続きでもう少し NTEmacs の設定にこだわってみる。私は数年前から UTF-8 でのみ作業するようになり、作成するファイルは特別な理由がない限り文字コード UTF-8 で編集・管理している。Windows で作業する場合にもなるべく UTF-8 な作業環境を実現したい。幸い NTEmacs を使用すればほぼ実現される。ただすべて希望通りにはいかない。今回はその試行錯誤の痕跡をメモしておく。

Continue reading

インド学仏教学における UTF-8 による TeX 文書作成 (4)

XeTeX の紹介

Jonathan Kew さんによる XeTeX とは、もともと Mac OS X 向けに開発された TeX に基づく Unicode 対応の組版システムである。現在では Windows や Linux にも移植されている。TeX の Unicode 化の試みとしては Omega (Ω) が知られているが、XeTeX はそれとは系統を異にする。従来からの TeX ユーザにとって目を引く特徴は、システム標準の TrueType や OpenType の Unicode フォントがそのまま使用できるという点だろう。コマンドラインツールの fc-list で返ってくるフォント名を、特別の設定なしに直接ソースファイルに指定することができる。現状では pTeX ほど十全な日本語組版は望めず、中国語・韓国語等のアジア言語へのサポートも十分とは言えない。

Continue reading

インド学仏教学における UTF-8 による TeX 文書作成 (3)

upTeX の利用

ttk さんによる upTeX は pTeX 内部処理の Unicode 化を果たしたもので、従来の JIS X 0208 (JIS 第一・第二水準) の制限から開放され、中国語・韓国語を含む極めて広範囲の文字の直接入力を可能としている。pTeX の和文組版をそのまま引き継いでいるので、pTeX のノウハウはそのまま upTeX にも通じる。一方で、インド系文字などを直接扱うことは、その守備範囲とはしていない。

Continue reading

インド学仏教学における UTF-8 による TeX 文書作成 (2)

変換処理の自動化

前回 に引き続いて UTF-8 による TeX 文書の作成について書いていく。

過去の投稿でいくつか latexmk について触れたが、この Perl で書かれたプログラムは bibtexmakeindex などの処理を必要とする文書に対して、適宜必要な回数だけコンパイルを実行してくれる。開発も盛んで (現行バージョン 4.25, 2011/07/07)、最新パッケージなどにも対応が早い。

Continue reading

インド学仏教学における UTF-8 による TeX 文書作成 (1)

紹介

Unicode を扱うことのできるワープロソフトやエディタの普及した現在においても、多言語処理能力という点において、いまだ LaTeX は他を凌駕していると言われる。しかし、新しく TeX を使って文書作成を試みようとする人がまず戸惑うのは、実際の画面表示と印刷イメージが同一ではないという点かもしれない。すなわち、印刷イメージでの文章の構造や見栄えの指定 (markup) を、テキストファイル内に記述しなければならず、そのシンタックスを覚えることは容易ではないように思えてしまう。しかし、TeX を巡る状況は幾分変化してきた。標準文字コードの UTF-8 への移行に伴い、TeX もまたその動向に合わせ改良が加えられてきた。また、エディタやプレビューアとの統合環境の整備に伴い、操作性も一段と向上した。結果、使用機種を問わず、互換性の高いテキストファイルで原稿作成を行いつつも視覚性を損なわず、簡単な操作で LaTeX の高品質な組版を実現することに成功している。

Continue reading

ローカル環境で Wikipedia 全文検索

Hyper Estraier による索引化と検索

EPWING 形式の Wikipedia データをモバイル PC や iPhone、iPad などの携帯端末に入れてオフラインで利用している方も多いだろう。 Project Bookends の尽力で、数式・図版・表組み・クロス検索・ユニコード外字拡張表示・あいまい検索等の拡張が組み込まれた EPWING 変換済みデータが自由にダウンロードできるので、FreePWINGWikipedia-fpw を利用して各自で変換する作業さえ必要なくなった。私自身も利用させていただいている。

Continue reading