いものやま。

雑多な知識の寄せ集め

「朝三暮四」について考えてみた。

この前、友人と会って話をしていたとき、「朝三暮四」という故事成語についてちょっと考え直すことがあったので、それについて。
あと、それに関連する強化学習の話やお金の話とか。

ことの起こり

どういう文脈で「朝三暮四」という言葉が出てきたのかをちゃんと覚えていないんだけど、「それって、朝三暮四の元になった故事じゃないけど、結局本質は何も変わってないじゃん」みたいな発言をしたのがキッカケ。
このとき、「朝三暮四」と「朝令暮改」の意味をなんか混同していたので、「『朝三暮四』の意味とは違うけどね・・・なんで『朝三暮四』の故事で『朝と暮れで言ってることが違う』という意味になるんだっけ?」と発言を続けて、なんでだろうという話になった。(※「朝と暮れで言ってることが違う」というのは、「朝令暮改」の方)

調べなおしたら、「朝三暮四」の意味は「目先の違いにとらわれ、結局は同じ結果なのに気がつかないこと」という意味で、つまり、正しい意味で使ってたと分かったのだけど、そこからの話がちょっと面白かったので、紹介したい。

そもそも「朝三暮四」って?

「朝三暮四」という故事成語は、次の故事に由来する言葉。

猿に「朝に3つ、暮れに4つ、ドングリ(餌)をあげる」と言ったら猿が怒ったので、今度は「朝に4つ、暮れに3つ、ドングリをあげる」と言い直したところ、猿は了承した。

つまり、いずれの場合も猿がもらえるドングリの総数は7個で変わっていないのだけど、猿はおバカで目先のことしか考えられない(=暮れのことは考えていない)ので、朝に3つだと少ないと怒り、朝に4つだと満足する、というお話。
このことから、「目先の違いにとらわれ、結局は同じ結果なのに気がつかないこと」という意味になった。

猿は本当におバカだったのか?

ところで、ここで友人が一言。

「でも、これって猿の方が正しい可能性あるよね」

ここで自分もハタと気づき、なるほど、と同意した。

友人は続ける。

「朝に3つ、暮れに4つっていうけど、暮れに本当に4つもらえるか分からないもんね。同じように、朝に4つ、暮れに3つの場合も、暮れに本当に3つもらえるかどうかは分からない。それなら、たとえ合計が同じであったとしても、先にもらえる朝に多くもらえる方が、価値が高いよね」

そう、まさにその通り。
未来に行けば行くほど、不確実性は増していく。
なので、トータルでは同じ量であったとしても、先に多くもらえる方が価値が高い。

友人はそこからボーナスの話を例に出していたけど(ボーナスが同じ4ヶ月分でも、夏と冬に2ヶ月分ずつもらえるのと冬にまとめて4ヶ月分なら、前者の方がいい、という話)、自分は強化学習の話とかお金の話に考えを飛ばしていた。

強化学習における「割引率」

強化学習については強化学習について学んでみた。(その1) - いものやま。からの一連の記事を参照してもらいたいんだけど、強化学習の問題設定では、「割引率」というものを考えたりする。
これは、将来もらえる報酬をどれくらい現在の価値として考慮に入れるかを表す0以上1以下のパラメータで、通常は1未満の値にすることが多い。(強化学習について学んでみた。(その9) - いものやま。も参照。ただし、ゲームだと1にすることも多い)

例えば、行動Aを選ぶと直後に10万円、行動Bを選ぶと10年後に10万円もらえるとする。
このとき、どちらの行動を選ぶかといえば、当然行動Aを選ぶことになる。
なぜなら、直後に10万円を貰えたのなら、その10万円を即座に使うことが出来るけれど、10年後に10万円を貰えるのだと、その10万円を使えるようになるまで10年待つことになる。
すぐに使えるのか、それとも10年待つ必要があるのか、という部分が、価値に差を与えてくる。

このことを考慮に入れるためのパラメータが割引率で、すなわち、将来もらえる報酬に(通常)1未満の数を掛ける(=価値を割引く)ことで、上記のことを考慮に入れられるようにしている。

この割引率の考えを導入すれば、猿の価値判断は全く正しくて、例えば仮に暮れの価値の割引率を0.8とすると、

  • 朝3つ、暮れ4つの価値: 3x1.0 + 4x0.8 = 6.2
  • 朝4つ、暮れ3つの価値: 4x1.0 + 3x0.8 = 6.4

と、朝に4つもらう方が価値が高くなっている。

これは考えてもみれば当然で、例えば仮に「1年後にドングリをまとめて2,555個(=7x365)あげる」なんて言われた場合、そもそも猿は飢えて死んでしまってドングリを受け取ることは出来ない!(薩摩藩が借金を数百年払いとかにして踏み倒してたような感じ)
これを割引率で考えてみると、仮に「朝→暮れ」「暮れ→次の朝」ごとに価値が0.8倍になるのだとしたら、1年後にもらえるドングリ1個の価値は、0.8^(2x365) ≒ 1.8x10^(-71)となり、直近に2,555個ドングリをもらう価値に相当するドングリの数は、約1.4x10^74個必要となってくる。(1無量大数が10^68)
そんな数のドングリを用意するのは、無理な話だ。
つまり、1年後にドングリをまとめてもらうのでは、いくらもらっても価値が全然足りない、ということを意味することになる。

このように、「割引率」を踏まえて価値判断をするというのは妥当と言えて、そういった意味で、猿の方が正しい判断が出来ていたと考えることも出来る。

ローンや利子の話

実は、これ(割引率)はお金の話にすごく関連が深くて、ローンや利子について哲学的に考えていくときに重要になってくる。

例えば、ローンを組むと、総額が一括払いをするときよりも高くなる。
一般にはその差額を「手数料」、すなわち、「ローン」というサービスを提供する代わりの対価として支払う、と解釈するわけだけれども、割引率の考えを入れてこれを分析すると、また違ったものが見えてくる。

割引率を \gamma 0 \lt \gamma \lt 1)、毎月返すお金を r_1, r_2, \cdots , r_N円としたとき、その価値の合計は、

 \gamma r_1 + \gamma^2 r_2 + \cdots + \gamma^N r_N

となる。

これだけの価値を現時点で代わりに支払ってもらうことになるわけだから、元金を Rとしたとき、価値の間に

 R = \gamma r_1 + \gamma^2 r_2 + \cdots + \gamma^N r_N

という関係があることになる。

ここで、 0 \lt \gamma \lt 1であることから、 0 \lt \gamma^k \lt 1, \forall k \in \{1, 2, \cdots , N\}であるので、

 R \lt r_1 + r_2 + \cdots + r_N

という関係が導き出せる。
つまり、ローンを組んで分割で支払う場合、一括で支払うよりも多く支払わないと、価値として釣り合わない、ということが導き出せる。
この差分こそが、価値を等価にさせるために余分に必要になってくるお金だ、と。
サービスに対する対価としてではなく、価値の等価交換の結果であると考えることが出来る。

さらに、ローンには元利均等方式(毎月支払う金額(=元金の返済分と利子)が一定)と元金均等方式(毎月返す元金の額が同じ)があり、

  • 元利均等方式は、毎月支払う額は同じだけど、支払金額の合計は元金均等方式より多い
  • 元金均等方式は、最初、支払う額が多いけど、支払金額の合計は元利均等方式より少ない

という違いがある。

この(元利均等方式の支払合計)>(元金均等方式の支払合計)というのも割引率の考えから導き出せる。

簡単にするために、方式Aの毎月の支払額を r_1 = r_2 = \cdots = r_N = k、方式Bの毎月の支払額を r'_1 \gt r'_2 = r'_3 = \cdots = r'_N = k'とする。

このとき、方式Aでは、

 R= \gamma k + \gamma^2 k + \cdots + \gamma^N k

であり、方式Bでは、

 R = \gamma r'_1 + \gamma^2 k' + \cdots + \gamma^N k'

となる。

ここで、それぞれの式は、

 R = (k - k') (\gamma + \gamma^2 + \cdots + \gamma^N) + k' (\gamma + \gamma^2 + \cdots + \gamma^N)

 R = (r'_1 - k') \gamma + k' (\gamma + \gamma^2 + \cdots + \gamma^N)

と変形出来るから、この2つの式を比べることで

 (k - k') (\gamma + \gamma^2 + \cdots + \gamma^N) = (r'_1 - k') \gamma

となる。

この両辺を \gamma (\ne 0)で割って、

 (k-k') (1 + \gamma + \cdots + \gamma^{N-1}) = r'_1 - k'

ところで、 0 \lt \gamma \lt 1であることから、 0 \lt \gamma^k \lt 1, \forall k \in \{1, 2, \cdots , N\}であるので、

 r'_1 - k' = (k - k') (1 + \gamma + \cdots + \gamma^{N-1}) \lt (k - k') (1 + 1 + \cdots + 1) = N(k - k')

この式を整理すると、

 Nk \gt r'_1 + (N - 1)k'

となり、方式Aの支払合計( Nk)が、方式Bの支払合計( r'_1 + (N - 1)k')よりも多くなることが示される。

この議論を方式Bの2回目以降の支払についても再帰的に展開すると(つまり、方式Bの2回目以降の支払を新たな方式A'と考えて、同様に方式B'を考える)、元金均等方式と同様に、支払金額が徐々に下がっていくことになる。
そのことから、(元利均等方式の支払合計)>(元金均等方式の支払合計)ということが導き出せる。

数式を出してるのでちょっと難しくなってるけど、肝心なのはつまり、未来のお金の価値を現在で評価する場合、価値を割引いて評価しないといけないよ、ということ。
この考え方を使うことで、このように、ローンで手数料が必要となる根拠を示すことが出来ている。

これは「お金になぜ利子が発生するのか」というのも同じで、同様に考えることが出来る。
つまり、利子は銀行がお金を稼ぐためにあるのではなく(実際には「実質利子」で儲けてるんだけど)、現在持っているお金を貸して未来でお金を返してもらう場合、割引率で価値が下がる分を補填する必要があるので、利子が発生する、と。
これは、より長期の定期預金の方が利子率が高い理由の説明にもなっている。
(実際にはここで「実質利子」を考えないといけないのだけど・・・)

ポイント値引き or 現金値引き

最後に、ちょっと別の話を。

某ケ○ズデ○キは、「ポイントより現金値引き!」をCMで謳ってるけど、実のところ、これは正しい。

これも、まさに「朝三暮四」の一例として「ポイントでも現金でも、同じ金額が値引きされるなら価値は同じ。それが分からないのはおバカ」と判断されそうだけど、実際にはそうじゃない。
同じ金額で値引きされるなら、現金で値引きされる方が圧倒的に価値が高い。

ポイントによる値引きと現金による値引きを比べた場合、重要なのは、「値引きで生じた価値」を「いつ」「どこで」使えるようになるのかというところ。

ポイントが付与された場合には、

  • ポイントは、「ポイントを付与した系列のお店で」「次に買い物をするとき」に使える
    • 一定のポイントが貯まらないと使えない場合もある(スタンプ10個で500円引き、など)
    • 一定期限が過ぎるとポイントは消失する場合がある
    • 買い物にしか使えない
    • 関連しないお店では使えない

一方、現金が値引きされた場合には、

  • そもそも価値が手元に残る
    • その価値は、買い物以外にも使える(貯金、投資、贈与、etc)
    • 買い物で使う場合にも、関連しないお店でも使える

つまり、ポイントの場合、その価値は「次の買い物」をするときまで発揮されないのに対し、現金の場合、そもそも価値が手元に残るので、いつでもどこでも使えるという違いがある。

この違いから、ポイントは「将来的に」価値を得ることが出来るというだけで、現時点では価値を手放しているとなっているので、その分だけ価値を割引いて考えないといけない。
さらには、ポイントの場合「有効期限がある場合がある」「関連するお店でしか使えない」という制限もあるので、そのことが現金に比べてより一層価値を下げることになる。
なので、現金で値引きされるのでなくポイントが付与されるというのなら、現金より多くのポイントがもらえないのであれば、割に合わないことになる。

なお、反論としてポイント自体を価値(資産)とみなすということを考えることも出来るかもしれない。
その場合、現金の代わりにポイントという価値を得ているだけなので、貸借対照表的な考え方をすれば同価値だろう、と。
(現金もポイントも両方「資産」として計上する。この場合、資産の総量は同じになる)

でも、お店側の貸借対照表を考えてみると、そうはなっていない。
ポイントを付与した場合、資産には現金が入り、ポイントを資産と考えた場合にはさらに負債に付与したポイントが入ることになる。
一方、現金値引きした場合、資産に単に値引きされた分の現金が入ることになる。
見ての通り、このタイミングでみると、資産の総量はポイントを付与した場合の方が確実に多くなっている。
これをお客の方から見ると、買い物をしたタイミングでより多くのお金をお店に預けているということを意味する。
すなわち、現時点で使える資産をより多く手放している、と。
そのより多く手放した資産を回収できるのが「次の買い物」のタイミングなので、やはりそこにはタイムラグがあり、割引率を適用して考えないといけないということが分かる。
(ちょっと難しいかな・・・?)

ということで、もし現金値引きでなくポイントが付与されるだけという場合、より多くのポイントが付与されないと割に合わないとなってくる。

となると、お店の側からしたら、ポイントシステムの導入というのは得なのかどうか。
現金値引きに比べてより多くのポイントを付与しないといけないということは、最終的には現金値引きよりもより多く値引かないといけない可能性が出てくるし、システムの導入をするなら、システム導入費や維持費もかかってくる。
それでは、システムを導入するだけ損なのでは・・・?

実際には、これは損にならないことが多い。

というのも、まず1つには、「朝三暮四」ということで、現金による値引もポイントの付与も、本質的に同じだと考えている人たちにとって、その値引が現金によるものなのかポイントによるものなのかは重要でないと判断されることが多いから。
その場合、同額の値引であったとしても損とはみなされないので、相対的にお店側が得をしていることになる。
さらに、より多くのポイントを付与していれば、(実際には同価値にも関わらず)よりお得と判断されて、市場での競争力を得ることが出来たりする。

そして、「ポイントは一定期間が過ぎると消失する場合がある」「関連しないお店では使えない」ということが、そのお店での購入意欲を高めることになる。
このあたりは、ゲゼルの唱えた「減価する貨幣」や「地域通貨」と深い関わり合いがあったり。
このあたりについては、また別の機会に話したいと思う。

今日はここまで!