プログラマは、ソースプログラムの一部として(プラグマで)書き換え規則を指定することができる。 以下に例を示す。
{-# RULES "map/map" forall f g xs. map f (map g xs) = map (f.g) xs #-}
どの規則が発動したかを見るには-ddump-simpl-stats
というデバッグフラグを使えばよい。もっと情報が必要な場合は、-ddump-rule-firings
によって、個々の規則発動を見ることができるし、-ddump-rule-rewrites
なら、書き換えの前と後でコードがどんな風であったかを見ることができる。
構文の観点からは、以下がいえる。
一つのRULES
プラグマには零個以上の規則を書ける。規則の間はセミコロンで区切る。(このセミコロンはレイアウト規則によって生成されたものでもよい)
プラグマ内ではレイアウト規則が適用される。現在、新しいインデントの水準が設定されることはない。そのため、一つのRULESプラグマに複数の規則を書いて、レイアウトを使ってそれを区切りたい場合、外側の定義と同じ位置で開始するように配置しなければならない。
{-# RULES "map/map" forall f g xs. map f (map g xs) = map (f.g) xs "map/append" forall f xs ys. map f (xs ++ ys) = map f xs ++ map f ys #-}
さらに、閉じ括弧#-}
は開き括弧{-#
よりも右で始まっているようにするべきである。
全ての規則には名前があり、二重引用符で囲って示される。名前自体には全く意味はない。規則が何回発動したかを報告する際に用いられるだけである。
規則名の直後に段階番号(7.20.6.5. 段階制御を見よ)を書くこともできる。次のように。
{-# RULES "map/map" [2] forall f g xs. map f (map g xs) = map (f.g) xs #-}
ここでの「[2]」は、この規則が段階2以降(段階2を含む)で有効になることを意味している。逆の記法である「[~2]」を使うこともでき、規則が段階2まで有効(段階2自体は含まない)という意味である。
規則は特殊な段階制御記法"[~]"に対応している。これは、規則が有効になることが決してないことを意味する。この機能はプラグイン(9.3. コンパイラプラグインを見よ)用である。これによって、GHCには実行されないものの、パース、型検査などされ、プラグインによって利用可能になるような規則を定義することが可能になる。
規則中で言及される変数は、スコープにある(map
のように)か、forall
で束縛される(f
、g
、xs
のように)かのどちらかでなければならない。forall
で束縛された変数はパターン変数と呼ばれる。パターン変数は、型のforall
の場合と同じく、空白で区切る。
パターン変数には型シグネチャをつけても良い。パターン変数の型が多相的なら、その変数には型シグネチャが必須である。例えば、以下はfoldr/build
規則である。
"fold/build" forall k z (g::forall b. (a->b->b) -> b -> b) . foldr k z (build g) = g k z
g
の型は多相的なので、型シグネチャを与える必要がある。
規則の左辺は、最上位の変数を任意の式に適用したものでなければならない。例えば、以下のものは正しくない。
"wrong1" forall e1 e2. case True of { True -> e1; False -> e2 } = e1 "wrong2" forall f. f True = True
"wrong1"
では、左辺が適用でない。"wrong2"
では、左辺の先頭がパターン変数である。
規則は、それが言及する変数(のどれか)と同じモジュールにある必要はない。もちろん、それらはスコープになければならないが。
規則は全て暗黙にモジュールからエクスポートされ、したがって規則を定義したモジュールを直接または間接にインポートしたモジュールの全てで有効である。(つまり、AがBをインポートしていて、BがCをインポートしている場合、AをコンパイルするときにCの規則が有効である)この状況はインスタンス宣言の場合と非常に良く似ている。
RULEの内部において、「forall
」は他のフラグ設定の如何にかかわらずキーワードとして扱われる。さらに、RULE内部では、言語拡張-XScopedTypeVariables
が自動的に有効になる。7.13.8. 字句的スコープを持つ型変数 を見よ。
他のプラグマと同様、RULEプラグマは常にスコープの誤りを検査され、型検査される。型検査というのは、規則の左辺と右辺が型検査され、さらに同じ型でなければならないということである。しかし、規則が有効になるのは-fenable-rewrite-rules
フラグが有効な時だけである(7.21.2. 意味論を見よ)。
意味論の観点からは以下のことが言える。
規則は-fenable-rewrite-rules
フラグによって有効になる(つまり、最適化に使われる)。このフラグは-O
によって有効になり、(いつも通り)-fno-enable-rewrite-rules
で解除できる。(注意: 一方、-O
なしで-fenable-rewrite-rules
を有効にしても期待通りにはならないかもしれない。なぜなら-O
なしではGHCはインタフェースファイル中の全ての最適化情報を無視するからである。-fignore-interface-pragmas
、4.10.2. -f*
: プラットフォーム非依存のフラグを見よ。)-fenable-rewrite-rules
は最適化フラグであって、パースや型検査には効果を及ぼさないことに注意。
規則は左から右への書き換えの規則だとみなされる。規則の左辺の置換例であるような式が見付かると、その式は右辺(に適切な置換を施したもの)に置き換えられる。「置換例」というのは、左辺に、パターン変数について置換を施すことで、その式と等しくすることができる、という意味である。
規則の左辺と右辺が同じ意味かどうかについては、GHCは一切検証を試みない。これは一般的には決定不能であるし、興味深い場合について実行不可能である。これについて、責任は完全にプログラマにある。
GHCは規則が合流性や停止性を持つことを確かめようとはしない。例。
"loop" forall x y. f x y = f y x
この規則はコンパイラを無限ループさせる。
一つの呼び出しに複数の規則が適合する場合は、恣意的に一つが選ばれる。
現在、GHCでは、規則の左辺を式と照合するに当たって、非常に単純で構文的な照合アルゴリズムが使われている。左辺と式を、α変換を法として構文的に等しくするような置換を探すのである。パターン(規則)は必要ならη展開されるが、式はされない。(式をη展開すると遅延性にかかわるバグにつながる)。また、β変換(高階照合と呼ばれる)は行わない。
照合はGHCの中間言語で行われる。この言語には型抽象と型適用があるので、規則は型が合うときのみ適合する。下の7.21.5. 特殊化 を見よ。
GHCは、最適化過程において、常に規則を適用しようとする。例として以下のものを考えてみよう。
let s = map f t = map g in s (t xs)
式s (t xs)
は規則"map/map"
に適合しないが、GHCはs
とt
を置換するので、結果として適合する式ができる。s
やt
が(a)二度以上使われていて、かつ(b)大きかったり簡約項だったりする、場合は、これらは置換されないので、規則が発動することもない。
通常のインライン化は規則による書き換えと同時に起きる。これによって予期せぬ結果につながることがある。次の(人為的な)例を考えよ。
f x = x g y = f y h z = g True {-# RULES "f" f True = False #-}
f
の右辺は小さいので、g
へとインライン化され、次のような結果になる。
g y = y
次にg
がh
へとインライン化されるが、f
のRULEが発動する機会はない。GHCが逆にまずg
をh
へとインライン化していたら、f
のRULEが発動する機会はより大きかっただろう。
振る舞いを予測可能にするには、f
にNOINLINEプラグマかINLINE[phase
]プラグマを使って、RULEに発動の機会があるうちにインライン化されることがないようにすれば良い。
GHCは、仕事を複製することに関して非常に慎重である。例として次を考えよ。
f k z xs = let xs = build g in ...(foldr k z xs)...sum xs... {-# RULES "foldr/build" forall k z g. foldr k z (build g) = g k z #-}
xs
が二回使われているので、GHCはfold/build規則を発動しない。これは正しい動作である。なぜなら、xs
を計算するのに大量の作業が必要かもしれず、規則が発動したらその作業が複製されるからである。
しかし、場合によっては、この方針では慎重すぎることがある。例え簡約基を複製することになっても、規則に発動してもらいたい場合である。これが良案だということをGHCが見つけ出す方法はないので、そのことを宣言するためのCONLIKEプラグマを提供している。次のようにする。
{-# INLINE CONLIKE [1] f #-}
f x = blah
CONLIKEは、INLINEまたはNOINLINEプラグマに対する修飾子である。fを一つの引数(一般には、'='記号の左側にある引数の数)に適用することが十分低コストで、複製によって規則が発動するならば複製できる、ということを示す。(「CONLIKE」という名前は"constructor-like"の短縮形である。構築子(constructor)は確実にこの性質を持つので) CONLIKEプラグマはINLINE/NOINLINEの修飾子であるが、これは次のような事情による。すなわち、規則が発動する前にf
がインライン化されてしまわないことがはっきりしているのでない限り、f
を規則の左辺と照合するのは実際上意味がないからである。
RULES機構は、良く使われるリスト関数についての融合変換(伐採)を実装するのに使われている。「優良生産者」の構築した中間リストを「優良消費者」が消費する場合、このリストは完全に排除されるはずである。
以下のものが優良生産者である。
リスト内包表記
Int
およびInteger
およびChar
についての列挙(例えば['a'..'z']
)。
明示的なリスト(例: [True, False]
)
cons構築子(例: 3:4:[]
)
++
map
take
, filter
iterate
, repeat
zip
, zipWith
以下は優良消費者である。
リスト内包表記
array
(第二引数について)
++
(第一引数について)
foldr
map
take
, filter
concat
unzip
, unzip2
, unzip3
, unzip4
zip
, zipWith
(ただし引数一つについてのみ。両方が優良生産者の場合、zip
は片方のみと融合する)
partition
head
and
, or
, any
, all
sequence_
msum
よって、例えば以下のものは中間リストを生成しないはずである。
array (1,10) [(i,i*i) | i <- map (+ 1) [0..9]]
この一覧を拡張することはいつでもできる。良く使うPrelude関数でここに含まれていないものがあったら教えてほしい。
自分で優良生産者や優良消費者を書きたいときは、上の関数のPreludeでの定義を見てどうするか知ると良い。
書き換え規則を使って、GHCの昔の版で使えた、ある機能と同等のことを行える。例として、以下のものを考えよ。
genericLookup :: Ord a => Table a b -> a -> b intLookup :: Table Int b -> Int -> b
ここで、intLookup
は、キーがInt
の時に非常に高速に動作するgenericLookup
の実装である。genericLookup
が型Table Int b -> Int -> b
で呼ばれたときは代わりにintLookup
を使うようにさせたいと思うかもしれない。次のように書くことが可能だった。
{-# SPECIALIZE genericLookup :: Table Int b -> Int -> b = intLookup #-}
この機能はもはやGHCにはないが、書き換え規則を使って同等のことができる。
{-# RULES "genericLookup/Int" genericLookup = intLookup #-}
この少々奇妙な規則は、genericLookup
をintLookup
に、型が適合するときはいつでも置き換えるように指示するものである。さらに、SPECIALIZE
プラグマの場合と違って、この規則はgenericLookup
と同じモジュールにある必要がない。(SPECIALIZE
プラグマの場合は、特殊化するのに元の定義が必要である)
intLookup
がちゃんとgenericLookup
の特別な場合として振る舞うようにするのはあなたの責任である!!!
RULES
を使った特殊化が高い効果をあげる例を一つ挙げる。
toDouble :: Real a => a -> Double toDouble = fromRational . toRational {-# RULES "toDouble/Int" toDouble = i2d #-} i2d (I# i) = D# (int2Double# i) -- Glasgowのprim-opを直接使う
i2d
関数は、事実上、機械語命令一個である。これに比べると、Rational
を経由した通常の変換は、非常識なまでに効率が悪い。
このモジュールで定義された規則を見るには、-ddump-rules
を使う。これには特殊化過程で生成されたものも含むが、他モジュールからインポートされたものは除外される。
どの規則が発動したかを知るには-ddump-simpl-stats
を使う。-dppr-debug
も加えればより詳細な出力が得られる。
-ddump-rule-firings
や-ddump-rule-rewrites
を使うと、どの規則が発動したかを極めて詳細に見ることができる。-dppr-debug
を加えるとさらに詳細な一覧が得られる。
例えば、GHC/Base.lhs
のbuild
の定義は以下の様になっている。
build :: forall a. (forall b. (a -> b -> b) -> b -> b) -> [a] {-# INLINE build #-} build g = g (:) []
INLINE
が使われていることに注意。これのおかげで、PrelBase
をコンパイルするときに(:)
がインライン化されることがなく、結果としてインポート元のモジュールが(:)
を「見る」ことができ、これを規則の左辺に適合させることができる。INLINE
があると、そのINLINE
なものの右辺にインライン化が発生することが抑制される。私はこの気遣いを後悔している。
融合変換を行い、融合が起こらなかった場合でも効率的なプログラムになるような規則の書き方についてはlibraries/base/GHC/Base.lhs
にあるmap
の規則を見よ。GHC/List.lhs
にも規則がある。
外部コア形式は「Note」注釈をサポートしている。CORE
プラグマを使うと、どういう注釈を入れるかをHaskellコード中で指定することができる。構文的には、core注釈は式に付属し、Haskellの文字列リテラルを引数として取る。以下の関数定義が例である。
f x = ({-# CORE "foo" #-} show) ({-# CORE "bar" #-} x)
意味上は、これは以下のものに等しい。
g x = show x
しかし、(-fext-core
で)外部coreが生成されるとき、式show
とx
にNoteが付加される。f
のcoreでの宣言は以下である。
f :: %forall a . GHCziShow.ZCTShow a -> a -> GHCziBase.ZMZN GHCziBase.Char = \ @ a (zddShow::GHCziShow.ZCTShow a) (eta::a) -> (%note "foo" %case zddShow %of (tpl::GHCziShow.ZCTShow a) {GHCziShow.ZCDShow (tpl1::GHCziBase.Int -> a -> GHCziBase.ZMZN GHCziBase.Char -> GHCziBase.ZMZN GHCziBase.Char) (tpl2::a -> GHCziBase.ZMZN GHCziBase.Char) (tpl3::GHCziBase.ZMZN a -> GHCziBase.ZMZN GHCziBase.Char -> GHCziBase.ZMZN GHCziBase.Char) -> tpl2}) (%note "bar" eta);
ここで、関数show
(これは展開されてShow辞書についてのcase式になっている)に%note
が付属していることが分かる。eta
(x
という名前だったもの)も同様である。