| ID:L-CH0057 | |||||
| データ収集日:2024年1月17日 | |||||
| 聞いた素材:「データに隠れた規則性を探せ!〜パターンが織りなす構造とAI〜」杉山 麿人 - 国立情報学研究所 2021年度 市民講座 第1回 | |||||
| https://youtu.be/i--NoqxSScA | |||||
| 行番号 | 聞いた素材 | 協力者の発話内容 | データ収集者の発話内容 | 備考 | |
| 発話 | 日本語訳 | ||||
| 1 | みなさんこんにちは, | 大家好。 | みなさんこんにちは。 | ||
| 2 | 国立情報学研究所の杉山麿人です。 | 我是国立情报学研究所的杉山麿人。麿这个字,我不太认识。 | 私は国立情報学研究所の杉山麿人です。麿という字は,あまり見たことがありません。 | ||
| 3 | まひと,という音は聞き取れたということですね。 | ||||
| 4 | 嗯嗯。 | はいはい。 | |||
| 5 | 今回は,データに隠れた規則性を探せというタイトルで,30分ほどお話しさせていただきます。 | 呃,今天我会针对,呃,寻找数据中隐藏的规则这个题目讲三十分钟。 | えー,今日私は,えー,データの中に隠れた規則を探すという題目に焦点を当てて30分お話しします。 | ||
| 6 | この講演では質問とアンケートを募集しています。 | 呃,这个讲座中在,呃,收集问题和问卷。 | えー,この講座では,えー,質問とアンケートを集めています。 | ||
| 7 | 市民講座のウェブサイトかYouTubeの概要欄をご覧ください。 | 请大家看市民讲座的网站,或者是YouTube的概要栏。 | 市民講座のウェブサイトか,YouTubeの概要欄をご覧ください。 | ||
| 8 | お待ちしています。 | 嗯,等待大家。 | うーん,お待ちしています。 | ||
| 9 | まずは,この購買データ解析の例を少しお話ししようと思います。 | 呃,首先我想针对,嗯,购买数据解析的这么一个例子,嗯,跟大家讲一些内容。 | えー,まず,うーん,購買データ解析のこのようなある例について,うーん,内容をみなさんにお話ししたいと思います。 | ||
| 10 | スーパーマーケットがあったとして, | 嗯,假如有一个超市。 | うーん,たとえばあるスーパーがあります。 | ||
| 11 | まあ自分がたとえばスーパーマーケットのオーナーであるっていうことを想像してみてください。 | 嗯,请大家享受,请大家想象一下啊,自己是超市的老板。我第一遍说了享受是说错了。 | うーん,自分がスーパーの主人だと,楽しんで,想像してみてください。最初に言った楽しむは言い間違えました。 | ||
| 12 | どういう商品が売れているのかっていうのをデータから解析しようということを考えます。 | 嗯,现在开始,呃,考虑一下,呃,现在开始从这个数据中考虑一下,嗯,里面有一个什么样的商品。 | うーん,今から,えー,考えます,えー,今からこのデータから,うーん,中にどんな商品があるのか,考えます。 | ||
| 13 | たとえば,このスーパー,まあちょっと小さすぎますけど, | 呃,比如说这个超市,虽然这个超市可能看起来比较小 | えー,たとえばこのスーパー,このスーパーは小さく見えるかもしれませんが | ||
| 14 | なにが小さいと思いますか。 | ||||
| 15 | 我觉得应该是超市吧。 | スーパーだと思います。 | |||
| 16 | スーパーマーケットのなにが小さいと思いますか。サイズですか。 | ||||
| 17 | 对,我觉得是超市的规模大小。 | はい,スーパーの規模の大きさだと思います。 | |||
| 18 | 商品が4つあって, | 呃,有四种商品。 | えー,4種の商品があります。 | ||
| 19 | パンと卵とリンゴとそれから牛乳,4つある。 | 嗯,有面包,鸡蛋,苹果,牛奶这四种商品。 | うーん,パン,卵,リンゴ,牛乳という4種の商品があります。 | ||
| 20 | それで,たとえばお客さんが8人来て, | 然后我们假如说有八位顾客过来。 | そしてたとえば8人のお客さんが来ます。 | ||
| 21 | どのお客さんがどの商品を買ったかってのが記録されています。 | 这个数据中记录了这八位顾客,它们分别都买了什么样的商品。 | このデータに8人のお客さんが,それぞれどんな商品を買ったか記録されています。 | ||
| 22 | たとえば,1人目のお客さんはパンと卵と牛乳を買って帰った。 | 比如说第一位顾客它买了面包,呃,鸡蛋和牛奶回来了。 | たとえば1人目のお客さんがパン,えー,卵と牛乳を買って帰りました。 | ||
| 23 | 2人目のお客さんはパンとリンゴですね,を買って帰った。 | 第二位顾客买的是面包和苹果。 | 2人目のお客さんが買ったのはパンとリンゴです。 | ||
| 24 | そういうような情報がここにあります。 | 嗯,这上面,这上面写了一些这样子的信息。 | うーん,この上,この上にはこのような情報が書いてあります。 | ||
| 25 | で,この中から,どういう商品売れてるのかなってことを考えるわけですけど, | 我们是从这个数据中看哪一个商品卖得比较好。 | 私たちはこのデータの中からどの商品がよく売れているかを見ます。 | ||
| 26 | 最初は1つ1つの商品に注目して,それがどのぐらい売れたかっていうのを計算してみようと。 | 嗯,最开始呢,我们是看,呃,一个一个的商品,然后看它,呃,哪一个卖得比较好。 | うーん,最初は,えー,1つ1つの商品を見て,えー,どれがよく売れたかを,見ます。 | ||
| 27 | これは,いわゆる商品の購入頻度を計算するってことに対応します。 | 这个也就对应了,啊,商品的,啊,购入频度这么一个信息。 | これは,あ,商品の,あ,購入頻度という情報にも,対応しています。 | ||
| 28 | たとえば,パンは8人中7人のお客さんが買って帰っているということで, | 呃,比如说面包就是有,八位顾客中的七位顾客买了。 | えー,たとえばパンは,8人のお客さんの中で7人のお客さんが買いました。 | ||
| 29 | 8分の7で,0.875っていう頻度を計算することができます。 | 呃,也就是八分之七,算出来是零点八七五这样一个频度。 | えー,つまり8分の7で,計算すると0.875という頻度です。 | ||
| 30 | 同様にして,卵でしたら,3人のお客さんが買って帰っているので,8分の3で0.375っていう値を計算することができます。 | 呃,再看鸡蛋的话就是八个人,八位顾客里面三位顾客,计算一下是零点三七五的频度。 | えー,また卵の場合を見ると8人,8人のお客さんのうち3人のお客さん,計算すると0.375の頻度です。 | ||
| 31 | まあこういうふうにしてどの商品がどのぐらいの頻度かっていうのは,簡単に計算できると思うんですけど, | 呃,就像这样可以计算每一种商品它,是有,它是以什么样的频度被购买的。 | えー,このように各商品が,どんな頻度で購入されているか計算することができます。 | ||
| 32 | もう少し違うことを考えてみましょう。 | 呃,现在开始我们想一些不一样的事情。 | えー,今から少し違うことを考えます。 | ||
| 33 | 商品の組みあわせを考えて,たとえば2つの商品が,同時に買われている頻度ってのが,どのくらいかってことを考えます。 | 嗯,我们现在开始考虑一下,比如说,呃,买了两种商品,买两种商品的这个频度它是多少呢。 | うーん,今から,たとえば,えー,2種類の商品を買う,2種類の商品を買うという頻度がいくらか,考えてみます。 | ||
| 34 | たとえば,パンと牛乳っていうのを考えて,パンも牛乳も両方買って帰った人が何人いたかということを考えます。 | 比如说我们现在开始看,面包和牛奶,同时买了面包和牛奶的人占比是,多少呢。 | たとえば今から,パンと牛乳,同時にパンと牛乳を買った人の割合は,いくらか見ます。 | ||
| 35 | 今の場合だと,1人目の人と,えー5番目の人,7番目の人,8番目の人っていうふうに,4人が買って帰ってますので,8分の4で0.5っていうふうに計算することができます。 | 如果拿刚刚的例子来说就是,呃,第一位顾客,呃,第五位顾客,第七位顾客,第八位顾客,这八位顾客中的四个人买了,呃,面包和牛奶。所以就是八位中的四位顾客,算出来是零点五的频度。 | もし今の例を取って言うと,えー,1人目のお客さん,えー,5人目のお客さん,7人目のお客さん,8人目のお客さん,この8人のお客さんの中の4人が,えー,パンと牛乳を買いました。だから8人中の4人のお客さん,計算すると0.5の頻度です。 | ||
| 36 | 同様にして,たとえば卵と牛乳,両方買った人,何人いますかっていうのを考えると,えー1人目の人と5番目の人と,8番目の人というふうにして,ま,0.375という頻度を計算することができます。 | 呃,或者比如说是,呃,鸡蛋和牛奶,同时买了鸡蛋和牛奶的人是,呃,第一位顾客,然后第五位顾客,第八位顾客,嗯,算出来是8位顾客中的三位顾客,结果是零点三七五。 | えー,あるいはたとえば,えー,卵と牛乳,同時に卵と牛乳を買った人は,えー,1人目のお客さん,それから5人目のお客さん,8人目のお客さん,うーん,計算すると8人のお客さんの中の3人のお客さんで,結果は0.375です。 | ||
| 37 | で,おんなじように,商品の組みあわせを大きくしていくってことも可能で, | 嗯,像这样我们还可以把,呃,购入商品的这个,呃,规模再变得大一些。 | うーん,このように,えー,購入商品のこの,えー,規模を少し大きくすることもできます。 | ||
| 38 | 3つ,たとえばパンと牛乳と卵の3つとも買った人が何人いるかってことを計算することもできます。 | 呃,比如说,我们假定同时买了三种商品,面包,牛奶和鸡蛋同时购买了这三种商品的人是占了多少比例呢。 | えー,たとえば,同時に3種の商品を買ったと仮定して,パン,牛乳と卵という3種の商品を購入した人はどのぐらいの比率を占めるのでしょうか。 | ||
| 39 | さきほど大きくすると言ってたのですが,なにを大きくすると言っていたのでしょうか。 | ||||
| 40 | 嗯,具体来说我觉得是,把商品的种类搗ス。 | うーん,具体的に言うと,商品の種類を増やすのだと思います。 | |||
| 41 | 今の場合だと,1人目の人と5人目の人と8人目の人,というふうに3人いますので,ま,8分の3で0.375といいう頻度を計算することができます。 | 像刚刚的例子就是第一位顾客,第五位顾客和第八位顾客,这是八位顾客中的三位顾客,计算出来是零点三七五的结果。 | 今の例のように1人目のお客さん,5人目のお客さんと8人目のお客さん,というのは8人のお客さんの中の3人のお客さんで,計算すると0.375という結果です。 | ||
| 42 | で,こういう商品の組みあわせのことを,パターンと呼んだりして,こういう組みあわせ的なパターンの中で,重要なパターンをデータから見つけてくる, | 嗯,我们把商品的组合称为,「パターン[日本語で発話する]」,模式。呃,我们可以从数据中啊,找到啊,顾客的购买的模式。 | うーん,商品の組みあわせを「パターン」,パターンと呼びます。えー,私たちはデータの中から,お客さんの購入のパターンを,見つけることができます。 | ||
| 43 | こういった課題のことを,パターンのマイニングと呼んだりします。 | 啊,这就叫做,嗯,模式的「マイニング[日本語で発話する]」。「マイニング[日本語で発話する]」这个词我不太懂是什么意思。 | あ,これは,うーん,パターンの「マイニング」と呼ばれます。「マイニング」という言葉はどういう意味かわかりません。 | ||
| 44 | 先生はパターンのマイニングはどういうことだったか,説明したかったと思いますか。 | ||||
| 45 | 嗯,从视频来看的话,它上面写了,商品的组合等于「パターンのマイニング[日本語で発話する]」,所以我觉得应该就是商品组合的事情吧。 | うーん,動画を見ると,上に,商品の組みあわせイコール「パターンのマイニング」と書いてあるので,商品の組みあわせのことじゃないかと思います。 | |||
| 46 | パターンとはなにが違うのでしょうか。 | ||||
| 47 | 嗯,「パターンのマイニング[日本語で発話する]」应该是一个动作吧。要么就是寻找模式的,这样一种动作。但是「パターン[日本語で発話する]」应该就是名词的模式吧。 | うーん,「パターンのマイニング」は動作だと思います。あるいはパターンを探す,動作。でも「パターン」は名詞のパターンですよね。 | |||
| 48 | どんなものを探してくるということについては説明していましたか。 | ||||
| 49 | 嗯,寻找,呃,顾客的,呃,购买商品的模式。 | うーん,お客さんの,えー,商品を購入するパターンを,えー,探します。 | |||
| 50 | 今の場合だと,ま,たくさん売れている商品が知りたいので, | 像刚刚的例子,我们想知道卖得好的商品。 | 今の例のように,よく売れている商品を知りたいです。 | ||
| 51 | 誰が知りたいのでしょうか。 | ||||
| 52 | 嗯,就是想知道卖得比较好的商品。 | うーん,よく売れている商品を知りたいです。 | |||
| 53 | 誰が知りたいのでしょうか。 | ||||
| 54 | 啊,我们。 | あ,私たちです。 | |||
| 55 | 聞いている人全員でしょうか。 | ||||
| 56 | 我觉得是。 | そうだと思います。 | |||
| 57 | たとえば頻度が0.5以上のものを見つけてきましょう, | 啊,比如我们现在要看频度是零点五以上的东西。 | あ,たとえば今頻度が0.5以上のものを見たいとします。 | ||
| 58 | ってことを考えると,パンと牛乳,それからパンと牛乳の組みあわせ,この3つが半分以上の人が買って帰っている,頻出なパターンであるというふうに考えることができます。 | 刚刚那句话应该是,比如我们现在要找到,呃,频度是零点五以上的东西。比如说我们现在要看,呃,嗯,买了面包和牛奶的,嗯,模式。 | さっきのその話は,たとえば私たちが今,えー,頻度が0.5以上のものを見つけたいとします。たとえば私たちが今,えー,うーん,パンと牛乳の,うーん,パターンを,見たいとします。 | ||
| 59 | で,まあこれで,えっと頻出なパターンを,えっと全部見つけてくるってことができるんですけど,一見すごい簡単なことをやっているように見えると思います。 | 呃,我们现在能看到啊,这个「パターン[日本語で発話する]」的,模式的数字。嗯,其实看起来应该是非常简单的。 | えー,今,この「パターン」の,パターンの数字を見ることができます。うーん,実はとても簡単に見えると思います。 | ||
| 60 | パターンの中でどんなパターンを見つけてくるということについては言っていましたか。 | ||||
| 61 | 我没有太听懂。 | よく聞き取れませんでした。 | |||
| 62 | 単に1つ1つの商品,もしくは商品の組みあわせっていうのを持ってきて,それの頻度を計算して,でまあその頻度が高ければ出力すると,それをやっているだけなので, | 呃,我们把一个商品一个商品这样拿过来,或者是把,呃,就是商品和商品的组合拿过来,像这样子去计算。 | えー,1つ1つの商品を取り出して,あるいは,えー,商品と商品の組みあわせを取り出して,というふうに計算します。 | ||
| 63 | 一見すごいシンプルなことをやっていると思います。 | 嗯,看起来应该是非常简单的事情。 | うーん,とても簡単なことに見えると思います。 | ||
| 64 | だけど実は,これは結構大変で, | 嗯,但是这其实是一件非常难的事情。 | うーん,でもこれは実はとても難しいことなのです。 | ||
| 65 | ま,多くの場合,こうやって単純に,1個1個のパターンを確認するだけでは,えっと全部頻出なものを見つけるってことは不可能であるということが | 嗯,像这样子把,呃,商品的模式这样一个一个去排列其实是很难的。 | うーん,このように,えー,商品のパターンをこうやって1つ1つ並べるのは実はとても難しいことです。 | ||
| 66 | 少し考えてみると見えてきます。 | 我们稍微思考一下的话,就可以看到。 | 少し考えてみると,見えます。 | ||
| 67 | たとえば商品の数20個ってことを考えましょう。 | 呃,比如说我们现在考虑一下商品的数量是二十个。 | えー,たとえば今商品の数が20個だと考えてみましょう。 | ||
| 68 | ま,20個しかないスーパー,まあ,まだまだ全然小さいと思うんですけど, | 嗯,只有二十个商品的超市,嗯,虽然还很小 | うーん,20個の商品しかないスーパー,うーん,まだとても小さいですが | ||
| 69 | 20個あるとしましょう。 | 但我们还是假定它是二十个吧。 | でもやはり20個と仮定しましょう。 | ||
| 70 | え,そうすると一人ひとりの,あ,1つ1つのパターンが,買うか買わないかの2通りがあるので, | 嗯,这样子的话应该就有,呃,买或者不买,嗯,这样一个商品的模式。然后中间有一个ミトリ[日本語で発話する]这个词我没太听懂。 | うーん,このようにすると,えー,買うか買わないか,うーん,という商品のパターンがあります。そして中間に「ミトリ」という言葉があってこれは聞き取れませんでした。 | ||
| 71 | 2通りというのは,物の名前なのか,副詞なのか,数字のものなのか,このような感じのものだということを推測できたらお願いできますか。 | ||||
| 72 | 嗯,我觉得肯定是名词。 | うーん,きっと名詞だと思います。 | |||
| 73 | なにかの名前ではないかということですか。 | ||||
| 74 | 嗯,我感觉不是商品的名字。 | うーん,商品の名前ではない感じがします。 | |||
| 75 | それではパターンみたいな,なにかを説明している名前ということでしょうか。 | ||||
| 76 | 我觉得是的。 | そうだと思います。 | |||
| 77 | ま,20個ってことはパターンの数としては,2を20回かけた値,ま,2の20乗ですね。だいたい100万ぐらいなんですけど, | 呃,有二十个商品的话,那模式的数量就是,呃,二乘二,这样子乘下去就是二的二十次方。 | えー,20個の商品があった場合,そのパターンの数は,えー,2かける2,というようにかけていって2の20乗です。 | ||
| 78 | 100万個ぐらいのパターンがあります。 | 嗯,有一百万的,啊,就可以得到一百万的这样一个的,模式的数据。 | うーん,100万の,あ,100万のこのような,パターンのデータを得ることができます。 | ||
| 79 | その100万というのはどうやって計算したのでしょうか。 | ||||
| 80 | 嗯,应该就是二的二十次方吧。 | うーん,たぶん2の20乗でしょう。 | |||
| 81 | で,その100万個くらいのパターンに対して,それぞれの頻度を計算して,頻度が大きかったら出力するってことをやればいいんですけど, | 呃,针对这一百万的这个频度,呃,后面的我就没有再听懂了。 | えー,この100万の頻度に対して,えー,後ろは聞き取れませんでした。 | ||
| 82 | だいたいどのぐらい時間かかるかってのをざっくり計算してみると, | 如果是我们计算一下它具体要花多长时间的话 | もし具体的にどのぐらいの時間がかかるのか計算したら | ||
| 83 | 100万個の話のあとに時間がかかるという話をしているんですが,なにに時間がかかるか,なんの時間について話しているのでしょうか。 | ||||
| 84 | 嗯,我,我其实不太懂就是他这里是指的什么的计算时间。 | うーん,実はここで指しているのがなんの計算時間なのかあまりわかりません。 | |||
| 85 | まあ1秒もかからないですね。このぐらいだったら,一瞬でコンピューター使ったら計算できます。 | 啊,嗯,这个计算时间也花不了一秒,用,呃,电脑的话很简单就能计算出来。嗯,我现在明白了,这个应该就是二的二十次方,是,呃,要计算二的二十次方是要花多长时间吧。 | あ,うーん,この計算時間は,コンピューターを使ったら,1秒もかからないで,えー,簡単に計算できます。うーん,今わかりました,これは2の20乗,えー,2の20乗にどのぐらいの時間がかかるかですね。 | ||
| 86 | なので,まあ,まあまあ,大丈夫そうって感じなんですけど, | 嗯,所以应该是,嗯,没什么问题。 | うーん,だから,うーん,なにも問題はないはずです。 | ||
| 87 | 今度,商品の数40個だったとしましょう。 | 嗯,这次我们再假定商品的数量有四十个。 | うーん,今度は商品の数が40個だと仮定します。 | ||
| 88 | よん,ま,20個しか増えてないんですけど, | 嗯,虽然它也只揄チ了二十个 | うーん,20個増えただけですが | ||
| 89 | 40個のパターン全部チェックして, | 嗯,我们,呃,我们检查一下,这四十个商品 | うーん,えー,この40個の商品を,検査して | ||
| 90 | 堅実なものを見つけてくるっていうのをやろうとすると,10分かかります。 | 然后我们再假定要,找出这个「パターン[日本語で発話する]」的数据,这种情况下要花,呃,十,十点二分钟。 | そして,この「パターン」のデータを見つけるとすると,この場合,えー,10,10.2分かかります。 | ||
| 91 | 10.2分かかると言ってくれたのですが,そのことについて教えてもらえますか。 | ||||
| 92 | 嗯,应该就是计算二的,四十次方的这么一个时间吧。 | うーん,2の,40乗を計算する時間だと思います。。 | |||
| 93 | さっきよりはだいぶ時間かかるんですけど,まあ10分くらいだったらまだ,10分待てば答えが出てくるということであれば,ま,そんな大したことないかなっていうふうに思います。 | 虽然比刚刚的,嗯,也就是商品的数量是二十个的时候,要花很多时间,但是等个十分钟的话也就会出来结果的,所以也还好。 | さっきの,うーん,つまり商品の数が20個のときと比べると,時間がかかりますが,10分待てば結果が出るので,まあまあです。 | ||
| 94 | じゃあ今度50個ですね。また10個だけ商品の数を増やしてみました。 | 呃,现在是五十个。然,也就是又揄チ了十个商品。 | えー,今度は50個です。また10個の商品を増やしました。 | ||
| 95 | 50個だと,1週間かかります。全部チェックするのに。 | 嗯,五十个的话,要花一星期。也就是要,检查这些商品的时间? | うーん,50個の場合,1週間かかります。これらの商品を検査する時間です? | ||
| 96 | 1週間,まあ結構時間かかりますけど,まあ1週間待てば,自分の欲しかった答えが全部手に入るってことであれば,まあまあ1週間くらいコンピューターまわしっぱなしにして,まあできるって人は結構いるんじゃないかなっていうふうに思います。 | 嗯,虽然一周,很长,但是只要等一周的话,就可以拿到自己想要的结果,也还好。 | うーん,1週間は,長いですが,1週間待ちさえすれば,自分が欲しい結果が得られるなら,まあまあです。 | ||
| 97 | だけど今度じゃあ70個にしてみましょう。 | 嗯,但是我们现在假定有七十个商品。 | うーん,でも今度は70個の商品があると仮定します。 | ||
| 98 | パターンの数は2の70乗なんですけど, | 呃,模式的数量就是二的七十次方。 | えー,パターンの数は2の70乗です。 | ||
| 99 | これ全部確認するのに,ま,だいたいざっくりですけど,1万9000年かかります。 | 嗯,如果是全部计算的话,呃,大约要花,一万九千年的时间。 | うーん,もし全部計算すると,だいたい,1万9000年の時間がかかります。 | ||
| 100 | なにを計算したら1万9000年かかるのでしょうか。 | ||||
| 101 | 我还是不太清楚。听了很久还是不太清楚,他是,是要计算什么花这么久。 | えー,やはりよくわかりません。長く聞きましたが,なにを計算したらそんなに時間がかかるのか,やはりよくわかりません。 | |||
| 102 | 2の70乗を計算するだけで1万9000年もかからないということなんですね。 | ||||
| 103 | 对,我觉得计算二的其实七十应该不需要花那么久吧。 | そうです。2の70乗を計算するのはそんなに長い時間がかからないと思います。 | |||
| 104 | 1万9000年はまあもちろん全然無理で,あの生きてる間にはこの計算終わらないということで, | 呃,一万九千年的话,那是真的没有办法了。就是活着的期间也看不到它的结果了。 | えー,1万9000年の場合,本当にどうしようもありません。生きている間にその結果を見ることもできません。 | ||
| 105 | もう70個になっただけで,全然計算できない。 | 如果是七十个的话就没有办法计算了。 | もし70個だったら計算ができません。 | ||
| 106 | だけどまあ最近の,もしかしたらスーパーコンピューターとか,コンピューター発達したら,今でも1000個の並列とかありますし, | 但是最近的电脑也比较发达了。后面的那句话我就没听清了。 | でも最近のコンピューターは発達しています。後ろの話ははっきり聞こえませんでした。 | ||
| 107 | まあ1万並列ぐらいまでもしいけば, | 呃,这句话我也没有听懂。 | えー,ここも聞き取れませんでした。 | ||
| 108 | コンピューターのなにについて話しているか,推測できたら教えてもらえますか。 | ||||
| 109 | 就是在讲,呃,电脑的性能进步了,然后也可能不用花这么久了吧。 | えー,コンピューターの性能が進歩して,そんなに多くの時間がかからないかもしれない,と話しています。 | |||
| 110 | それは前後の文脈で推測してくれたのでしょうか。 | ||||
| 111 | 嗯,是的。 | はい,そうです。 | |||
| 112 | もしかしたら1年くらいで,この計算できるようになるかもしれません。 | 呃,说不定可以在一年之内完成这样子的计算。 | えー,1年のうちにこのような計算が完成できるかもしれません。 | ||
| 113 | まだ望みはあると。 | 还有希望。 | まだ希望はあります。 | ||
| 114 | ところが,もうちょっとだけ商品の数増やして,100個っていう状況を考えますと, | 嗯,我们想一下有一百个商品。 | うーん,100個の商品があると考えてみましょう。 | ||
| 115 | これ2の100乗なので, | 这样子的话,这里就变成了二的一百次方。 | このような場合,2の100乗になります。 | ||
| 116 | 全部確認するのに200億年かかっちゃいます。 | 如果要全部去确认的话要花二百亿年。 | もし全部確認すると200億年かかります。 | ||
| 117 | でまあ,だいたい宇宙の年齢137億年ぐらいとかって言われてるので,200億年もかかる計算というのはもう全然できるはずがなくて, | 嗯,一般来说宇宙的年龄是一百三十七亿年,如果是这个计算要花二百亿年的话,就完全做不了了。 | うーん,一般的に言って宇宙の年齢は137億年で,もしこの計算が200億年かかるなら,全然できません。 | ||
| 118 | コンピューターがちょっと高速になったらできるとかそういうレベルではもう全然ない。絶対できないっていうぐらい, | 嗯,这种情况下就算是电脑它再发达,也做不了。 | うーん,このような状況でたとえコンピューターがもっと発達しても,できません。 | ||
| 119 | むちゃくちゃ大量にパターンがある。 | 嗯,就是这样子非常,嗯,非常多的模式。 | うーん,このように非常に,うーん,非常に多くのパターンです。 | ||
| 120 | それでもまだ商品の数は100個しかないと,いう状況なので, | 就算是这样,商品的数字,也才是100。 | このようであっても,商品の数字は,たったの100です。 | ||
| 121 | とにかくやっている1つ1つのことは単純なんですけど, | 额,总之,我们做的一件一件的是虽然很单纯, | えー,とにかく,私たちがしている1つ1つのことは単純でも, | ||
| 122 | パターンの数が多すぎるので,それを計算するってことが,あの全然できないと, | 嗯,但就算是这样子的话,我们去计算这个模式的数量也,呃,非常地辛苦做不了。 | うーん,でもこのようであっても,このパターンの数を計算するのも,えー,とても大変でできません。 | ||
| 123 | まあそういう状況になってます。 | 就是这样子的情况。 | このような状況です。 | ||
| 124 | じゃあどうすればいいかっていうことなんですけど, | 那我们要怎么办呢。 | では私たちはどうしたらいいのでしょう。 | ||
| 125 | この今のパターンマイニングの場合ですと, | 嗯,用刚刚的,寻找模式的例子来讲。 | うーん,さっきの,パターンを探す例を使って話します。 | ||
| 126 | 頻度が持つ性質ってのをうまく使うことで,計算を効率化すると。それによって,その200億年かかるような | 呃,如果是将这个计算「パターン[日本語で発話する]」,计算模式的数字,嗯,让它更加高效的话, | えー,もしこの「パターン」を計算すること,パターンの数字を計算することを,うーん,効率的にすると, | ||
| 127 | 計算をすっ飛ばして,あの,まあ同じ答えを見つけてくるってことが可能になります。 | 要找到同样的东西。这一点我也没有太听懂。 | 同じものを見つけなければいけません。この点もよくわかりません。 | ||
| 128 | これは先ほどの,まあ商品の組みあわせを,少し違う書きかたをしているんですけど, | 这里的写法跟刚刚的写法虽然不太一样, | ここの書きかたはさっきの書きかたと違いますが, | ||
| 129 | 下から上に行くほどパターンのサイズが大きくなっていっているのがわかると思います。 | 从下面往上看的话,我们能知道商品的数量是在变多的。 | 下から上に見ると,商品の数が多くなっていることがわかります。 | ||
| 130 | で,それに対応して頻度も書いてます。 | 与之对应的频度也写在这里。 | これに対応する頻度もここに書いてあります。 | ||
| 131 | で,この矢印とこの頻度の関係をじっと見てみると, | 我们看一下这个箭头和频度的关系。 | この矢印と頻度の関係を見てみましょう。 | ||
| 132 | 頻度っていうのは,上に行けば行くほど,同じか,もしくは小さくなっているっていうことがわかっていただけると思います。 | 我想大家应该能明白,呃,越往上,这个频度它要么是一样,要么是越来越小。 | えー,上に行くほど,この頻度が同じか,だんだん小さくなるかだということが,みなさんわかると思います。 | ||
| 133 | たとえば牛乳の頻度は0.625なんですけど, | 比如说牛奶的频度是零点六二五。 | たとえば牛乳の頻度が0.625です。 | ||
| 134 | 牛乳とパンになると0.5になって, | 如果是牛奶和面包的话,就变成了零点五。 | もし牛乳とパンだったら,0.5になります。 | ||
| 135 | 牛乳とパンと卵になると0.375になっている。 | 如果是面包牛奶和鸡蛋的话,频度就是零点三七五。 | もしパンと牛乳と卵だったら,頻度は0.375です。 | ||
| 136 | で,これは必ず成り立つ性質で,矢印をどこでもいいので上にたどっていけばいくほど,必ず同じか小さくなっていくっていう性質が | 啊,这个,呃,性质呢是,呃,基本上在哪里都是一样的,也就是说,呃,箭头越往上,它的这个频度就要么是一样,要么是越来越小。 | あ,この,えー,性質は,えー,基本的にどこでも同じで,つまり,えー,矢印が上に行くほど,その頻度は同じか,だんだん小さくなるかです。 | ||
| 137 | 成りたってます。 | 什么时候都成立。 | いつでも成りたちます。 | ||
| 138 | これは一見不思議なんですけど,よくよく考えてみると当然で, | 虽然乍一看不可思议,但是好好想的话就挺正常的。 | 一目見ただけでは不思議ですが,よく考えると当たり前です。 | ||
| 139 | この頻度っていうのは何人がその商品買ったかってことなので, | 嗯,这个频度显示的是有几个人买。 | うーん,この頻度が示しているのは何人買ったかです。 | ||
| 140 | ま,たとえば牛乳をそもそも8人中5人しか買ってないってことなので, | 嗯,如果是牛奶的话,就是八个人里面只有五个人去买。 | うーん,もし牛乳だったら,8人の中で5人だけが買いました。 | ||
| 141 | 牛乳もパンも買った人が何人いるかって考えたら, | 嗯,那我们再想一下,又买了面包又买了牛奶的人,它是有几个人。 | うーん,では,パンも買い牛乳も買った人,というのは何人いるか,また考えてみましょう。 | ||
| 142 | 5人以上いるはずはないですよね。 | 嗯,就不可能会有五个以上的人。 | うーん,5人以上の人がいることはあり得ません。 | ||
| 143 | そもそも牛乳5人しか買ってないから。だから,この頻度っていうのは, | 啊,嗯,因为本来买了牛奶的人也就只有五个人。 | あ,うーん,もともと牛乳を買った人が5人しかいないからです。 | ||
| 144 | 絶対8分の5以上にはならない,あ,8分の5より大きくはならない | 所以呢,就是不可能比,啊,八分之五更大了。 | だから,あ,8分の5より大きくは,なり得ません。 | ||
| 145 | というふうになっています。 | 嗯,就是这样子的情况。 | うーん,このような状況です。 | ||
| 146 | ということは,今,頻度が高いパターンが欲しいので, | 也就是说,我们现在想要频度比较高的模式。 | つまり,今,頻度が高いパターンが欲しいです。 | ||
| 147 | どうして頻度が高いものがほしいのでしょうか。 | ||||
| 148 | 嗯,老师没有讲,啊,视频中的老师没有讲。但是我觉得应该就是,嗯,卖的最好的商品的模式吧。 | うーん,先生は言っていません,あ,動画の中の先生は言っていません。でも,うーん,一番よく売れている商品のパターンだと思います。 | |||
| 149 | この下のほうから見ていけば,全部を見なくても,頻度の高いパターンが手に入るんじゃないかってのが基本的なアイディアです。 | 嗯,从下面往上看的话,呃,不用看全部的也基本上,不是,不用看全部的,也能知道比较高的频度。 | うーん,下から上を見ると,全部を見なくても基本的に,いえ,全部を見なくても,高い頻度を知ることができます。 | ||
| 150 | ここで,まあ少し抽象的に,このすべてのパターンがなる空間というのを書いています。 | 呃,这里写着比较抽象的,这种模式的空间。 | えー,ここにちょっと抽象的な,このようなパターンの空間が書いてあります。 | ||
| 151 | それぞれの商品を,まあABCDって書いてまして, | 呃,每个商品像A,B,C,D这样写着。 | えー,それぞれの商品をA,B,C,Dのように書いています。 | ||
| 152 | 商品を買ったか買わなかったっていうのは,まあ1と0で,デジタルな感じで表現してます。 | 呃,买了商品和不买商品,我们是用一和零去表示的。 | えー,商品を買ったと商品を買わなかったを,1と0で表示しています。 | ||
| 153 | 1っていうのは,その商品を買ったってことで,0っていうのは,その商品を買わなかったということです。 | 一就表示了买了这个商品,零就表示了没买这个商品。 | 1はこの商品を買ったということを表示していて,0はこの商品を買わなかったということを表示しています。 | ||
| 154 | たとえば1人目の人はパンと牛乳と卵を買ってたと思うんですけど, | 呃,比如说第一个人就是买了,呃,面包,鸡蛋和牛奶。 | えー,たとえば1人目が,えー,パン,卵と牛乳を買いました。 | ||
| 155 | 1,1,0,1という文字列に対応している。 | 呃,这种情况就对应了一,一,零,一这样子的文字。 | えー,このような状況は1,1,0,1という文字に対応しています。 | ||
| 156 | で,この右側の図っていうのは,そのありうるパターンを全部書き並べていて, | 右面的这个图就是将所有可能的模式排列了起来。 | 右のこの図はすべての可能なパターンを並べています。 | ||
| 157 | パターンが大きくなるごとに,こう線を,こう引っ張っていってると,まあなんかそんな感じです。 | 呃,变大的话,「えーと[日本語で発話する]」,越变越大就是,嗯,用这些线连接了起来,这个我也没有太听懂。 | えー,大きくなると,「えーと」,大きくなればなるほど,うーん,これらの線で繋げて,これもよく聞き取れませんでした。 | ||
| 158 | なにが大きくなるかというのはわかりませんでしたか。 | ||||
| 159 | 应该就是买了商品的种类吧。应该就是种类越来越多的这么一个,意思吧。 | 買った商品の種類だと思います。種類が多ければ多いほどという,意味でしょう。 | |||
| 160 | 種類が多くなるというのは,種類が4種類,5種類になっていくということですか。 | ||||
| 161 | 我感觉是的。我也是猜的。 | そう感じます。推測です。 | |||
| 162 | そう推測したのは,先生の話からですか。 | ||||
| 163 | 啊,一个是画面上的这个图。再一个是前面一直说的,买的商品越多,就是从下往上看的话就是买的商品越来越多。 | ああ,1つは画面のこの図です。もう1つは前でずっと言っていた,買った商品が多いほど,つまり下から上に向かって見ると買った商品がどんどん多くなるということです。 | |||
| 164 | で,あとは頻度を全部のパターンにそれぞれ書いてます。 | 嗯,然后这里就写着,嗯,各种频度的模式。 | うーん,そしてここには,うーん,いろいろな頻度のパターンが書いてあります。 | ||
| 165 | で,たとえば,この状況で,頻度が,じゃあ8分の3以上のパターンを全部見つけるということをやりましょう。 | 嗯,我们现在假设,呃,找到八分之三以上频度的,嗯,模式。 | うーん,今,えー,8分の3以上の頻度の,うーん,パターンを見つけると,仮定します。 | ||
| 166 | そうすると,この今赤で色を付けたところが実はちょうど対応しているんですけど, | 嗯,现在标红的地方就对应了我们现在所说的情况。 | うーん,今赤く表示したところが今言った状況に対応しています。 | ||
| 167 | これはまあざっと見ていただくとわかるように,この全体の空間の,この下のほうに固まっているというのがわかっていただけると思います。 | 呃,大概一看也能知道这种情况对应了这张图的下面的部分。 | えー,たぶん一目見てこのような状況にこの図の下の部分が対応していることがわかります。 | ||
| 168 | 頻度っていうのは上に行けば行くほどだんだん小さくなるので,頻度が高いものを見つけるってことは,この下のほうの空間を見つけてくるということに対応している。 | 嗯,越往,这个图越往上看,嗯,就是买的商品越来越多,如果是要找频度比较高的,就是,嗯,对应了图的下边的部分。 | うーん,この図は上に向かって見るほど,うーん,買った商品が多くなって,もし頻度が高いものを見つけたければ,うーん,図の下の部分が対応しています。 | ||
| 169 | じゃあこれを探すっていうのはどうすればいいかっていうと,下から順番にチェックしていって,あの,欲しいものを見つけるということをやればいい。 | 如果要找到,嗯,这个,找到什么具体我没有太听清。后面的内容就是从下往上看,一个一个看的话,就能找到自己想要的模式。 | もし見つける,うーん,この,具体的になにを見つけるのかは聞こえませんでした。後ろの内容は下から上に向かって見る,1つ1つ見ると,自分の欲しいパターンが見つけられる。 | ||
| 170 | どうして下から見たほうがいいと先生は言ったのでしょうか。 | ||||
| 171 | 嗯,应该是从,就是,频度的高低来判断的吧。 | うーん,たぶん,頻度の高低から判断するのだと思います。 | |||
| 172 | 頻度は下のほうはどうだと言っているのですか。 | ||||
| 173 | 下面的频度是,就是从下往上,这个频度应该是越来越小的。 | 下の頻度は,下から上に向かって,頻度はだんだん小さくなるのだと思います。 | |||
| 174 | 下から見て,なにを探しているのかはわかりましたか。 | ||||
| 175 | 嗯,就是找频度大于八分之三的。 | うーん,頻度の高さが8分の3のものを探しています。 | |||
| 176 | たとえば,まず0,0,0,0から出発して,最初1,0,0,0パンを買った人ってところをチェックする。 | 嗯,比如说我们就从零零零零这里开始看,然后再往上看到买了面包的人。 | うーん,たとえば0000ここから見はじめて,上に行くとパンを買った人が見えます。 | ||
| 177 | で,頻度は8分の7なので8分の3より大きいので,たとえば次こっち行って, | 呃,这里的频度是八分之七。呃,比我们想找的频度要大。 | えー,ここの頻度は8分の7です。えー,私たちが見つけたいものより頻度が高いです。 | ||
| 178 | パンも卵も買った人って何人いるかというのをチェックする。 | 呃,然后我们再往上看,也买了鸡蛋的人是多少人。 | えー,そしてさらに上に行って,卵も買った人が何人か見ます。 | ||
| 179 | そうすると8分の3なので,まだOKってことで,もう1こ上に行くと。 | 嗯,这里就是八分之三,也是没问题的。然后我们再往上看。 | うーん,ここは8分の3で,問題ありません。そしてさらに上に行きます。 | ||
| 180 | で,そうするとパンと卵とリンゴを買った人なんですけど, | 呃,这里就是,嗯,买了面包和鸡蛋和苹果的人。 | えー,ここは,うーん,パンと卵とリンゴを買った人です。 | ||
| 181 | これは1人しかいないので, | 只有一个人。 | 1人だけです。 | ||
| 182 | 頻度8分の3を超えてない。 | 就没有超过八分之三这个频度。 | 8分の3という頻度を超えていません。 | ||
| 183 | ということでこれはいらないってことなんですけど, | 所以这个地方就不需要了。 | だからここは必要ありません。 | ||
| 184 | これなにを教えてくれるかっていうと, | 嗯,那这件事情是告诉我们什么呢。 | うーん,ではこのことは私たちになにを教えてくれるのでしょうか。 | ||
| 185 | もう1こ上ですね,この全部の商品を買った人っていうのは, | 我们再往上看,看到买了所有商品的人。 | また上に行くと,全部の商品を買った人が見えます。 | ||
| 186 | この1こ手前の頻度よりも絶対に大きくはならないので, | 它比它前面的频度,是绝对不会变大的。 | これはこの前の頻度より,絶対大きくはなりません。 | ||
| 187 | もう,この頻度っていうのは見ることなく8分の1以上,より大きくはないということが保証されるということになります。 | 嗯,我们,嗯,不用看这个频度就会知道,它比它前面的频度,是绝对不会变大的。这一点是被保证的。 | うーん,私たちは,うーん,この頻度を見なくても,これがこの前の頻度より,絶対大きくはならないことがわかります。この点は保証されます。 | ||
| 188 | なので,この1,1,1,1というすべての商品を買った人がどのくらいいたかっていうのは計算をする必要すらないということがわかります。 | 所以就是,买,呃,就是没有必要再去计算买了所有商品的人。 | だから,えー,全部の商品を買った人を計算する必要がありません。 | ||
| 189 | 1こ手前がもう全然頻度が足りないので, | 因为它前面的频度就已经不够了。 | その前の頻度がもう足りないので。 | ||
| 190 | 上はもう見る必要がない。 | 所以就没有必要再看上面的了。 | だから上を見る必要はありません。 | ||
| 191 | 今の場合そういうふうにして順番にチェックしていくと, | 像这种情况,我们看一下,嗯,上面的顺序。 | この状況のように,うーん,上の順序を,見てみましょう。 | ||
| 192 | この3つのパターンに対して,あの,実際には計算をする必要すらなくて, | 对于这三个,对于这三种模式,嗯,就没有必要说再去计算了。 | この3つに対して,この3種のパターンに対して,うーん,計算する必要がありません。 | ||
| 193 | 見なくていいというのが出てきます。 | 也就是,不看也行。 | つまり,見なくてもいいのです。 | ||
| 194 | で,今の場合は,あの,商品の数が4つしかなかったので, | 呃,刚刚的情况是商品只有四个。 | えー,さっきの状況は商品が4つだけでした。 | ||
| 195 | まあ見なくていいパターンというのは3つしかない,あんまり得してないんですけど, | 呃,不用看的模式有三个。 | えー,見なくていいパターンは3つありました。 | ||
| 196 | 実際にたとえば100個とか,あの,になってくると, | 嗯,实际上如果有一百个商品的话, | うーん,実際もし100個の商品があったら, | ||
| 197 | 200億年かかるぐらいのこのむちゃくちゃ大量の空間ってのがあるわけで, | 就会有一个,就会出现一个非常大量的空间。 | 非常に大量の空間が出現するでしょう。 | ||
| 198 | その大量の空間のほとんどすべてっていうのは見なくていいと。 | 也就是说,这个大量的空间里,基本上很多模式都没有必要去看。 | つまり,この大量の空間の中で,基本的に多くのパターンが見る必要がありません。 | ||
| 199 | この下のほうだけをチェックしていって,自分が欲しい頻度の高いパターンだけを取りだしてくる。まあそういうことをすればいいというふうになります。 | 也就是说,我们从下往上看,然后找到自己想要的频度就好了。 | つまり,下から上に向かって見て,自分が欲しい頻度を見つければそれでいいのです。 | ||
| 200 | ここまで話を聞いてみて,この右側の図なんですが,上と下はどんなふうに並べてあると思いますか。 | ||||
| 201 | 就是下面的是,同时买了,嗯,零个或者是一个商品的情况。 然后越往上,它买的商品的种类就越多。 |
下のは,同時に,うーん,0個あるいは1個の商品を買った状況です。そして上に行くほど,買った商品の種類が多くなります。 | |||
| 202 | 先生はどうして上のほうを見なくてもいいと言ったのでしょうか。 | ||||
| 203 | 嗯,因为这里想,得到的结果是大于某一个数字,像这里的话就是大于八分之三。 | うーん,ここは,得たい結果がある数字の大きさで,ここのような場合は8分の3の大きさだからです。 | |||
| 204 | どうして先生は8分の3以上を見たいと思ったのでしょうか。 | ||||
| 205 | 嗯,因为目的应该是要找到,嗯,卖的最好的组合。 | うーん,目的が,うーん,一番よく売れている組みあわせを見つけることだからです。 | |||
| 206 | 少し前に200億年もかかるのかがわからないと言っていましたが,今それがわかったのはどうしてでしょうか。 | ||||
| 207 | 嗯,我觉得我还是没有特别清楚,但是应该仅仅是二十的二十次方,或者二十的三十次方这样子的数字吧。嗯,不是。我是,嗯,我是觉得可能没有那么简单,就是不是单纯的计算,说二十的二十次方或者是二十的三十次方。 | うーん,まだあまりはっきりわからないのですが,たかだか20の20乗,あるいは20の30乗という数字ですよね。うーん,違います。うーん,そんなに簡単ではない,20の20乗あるいは20の30乗のような,単純な計算ではないのかもしれないと思います。 | |||
| 208 | こういうふうに下から順にチェックしていって,自分の好きなところで止めるっていうような方法のことをアプリオリっていうふうに呼んでて, | 嗯,像这样子从下往上按顺序去,呃,检查的这么一个,嗯,方法叫做「アプリオリ[日本語で発話する]」。 | うーん,このように下から上に向かって順序に従って,えー,検査するこのような,うーん,方法を「アプリオリ」と呼んでいます。 | ||
| 209 | もともと1994年に提案された手法なんですけど, | 这个方法是一九九四年被提出来的。 | この方法は1994年に提起されました。 | ||
| 210 | 今でもこの同じ原理が使われています。 | 现在这个原理也被运用着。 | 今もこの原理が運用されています。 | ||
| 211 | で,これを使うことによって,たとえば商品数が100のとき, | 呃,用这个方法,比如说我们假定有一百个商品。 | えー,この方法を使って,たとえば100個の商品があると仮定します。 | ||
| 212 | もしなにも考えずに全部チェ,確認していたら,200億年かかっていたんですけど, | 呃,如果是,呃,刚刚我们说的就是,要花二百亿年。 | えー,もし,えー,さっき私たちが言ったのだったら,200億年でした。 | ||
| 213 | アプリオリを使えば数秒,時には1秒以下で同じものを計算することができる。 | 呃,如果用「アプリオリ[日本語で発話する]」这个方法的话,就,只要几秒,有的时候只要一秒就计算出来了。 | えー,もし「アプリオリ」という方法を使ったら,数秒だけ,時には1秒だけで計算ができます。 | ||
| 214 | で,得られる結果はまったく同じです。 | 嗯,得到的结果,是完全一样的。 | うーん,得られる結果は,まったく同じです。 | ||
| 215 | なので200億年かけて計算するか,ま,1秒でこのアプリオリで計算するかっていうのはもう全然違うわけですけど, | 嗯,是花二百亿年去计算,还是说用这个啊,软件,嗯,去计算是完全不一样的。 | うーん,200億年かけて計算するか,この,ソフトを,うーん,使って計算するかで,まったく違います。 | ||
| 216 | 出てくる結果はまったく一緒です。 | 但出来的结果是完全一样的。 | でも出てくる結果はまったく同じです。 | ||
| 217 | だからなにも損することなく,ただただ,ま,200億倍ぐらい高速にできると,そういうことになっています。 | 嗯,就是别的什么事情都不用做,呃,都要比之前的要快,二百倍,二百倍。 | うーん,ほかのどんなこともすることなく,えー,前のより,200倍,200倍,速くなります。 | ||
| 218 | これはパターンが待つ性質っていうのをうまく使ったことで, | 呃,这个就是利用了模式的这种性质。 | えー,これはパターンのこのような性質を利用しています。 | ||
| 219 | あの,上に行けば行くほど,頻度が小さくなる,そういう性質によって,うまく解決できたということになります。 | 也就是从下往上看,嗯,它的频度越来越小的这么一个,性质,这个问题就解决了。 | つまり下から上に向かって見ると,うーん,頻度がだんだん小さくなるという,性質が,この問題を解決しました。 | ||
| 220 | この,商品の数が少し増えただけで, | 嗯,仅仅因为,商品的数量揄チ了, | うーん,商品の数量が増えたことだけで, | ||
| 221 | 確認しないといけないパターンが,むちゃくちゃ増えてしまうっていうのは, | 嗯,需要确认的商品的模式就会揄チ得非常多。 | うーん,確認が必要な商品のパターンがとても増えます。 | ||
| 222 | 爆発的に数が増えるってことで,組みあわせ爆発と呼んだりするんですけど, | 嗯,这种就被称作组合爆发。 | うーん,これは組みあわせの爆発と呼ばれます。 | ||
| 223 | この組みあわせ爆発の,まあ面白さであったり,恐ろしさってものについては,ま,こちらの動画,すごい有名なものなので,ご存じのかたも多いかもしれないですけど, | 嗯,关于组合爆发的有趣的地方,或者是可怕的地方,嗯,下面的这个动画比较有名。嗯,知道的人应该也很多。 | うーん,組みあわせの爆発のおもしろいところ,または怖いところについては,うーん,下のこの動画が有名です。うーん,知っている人も多いはずです。 | ||
| 224 | あの,ぜひ,もしご興味があったらご覧いただけたらというふうに思います。 | 如果感兴趣的话,还请去看一下。 | 興味があったら,見てみてください。 | ||
| 225 | ここまでは,えーと商品の組みあわせってものについて,少し具体例を使って説明してきたんですけれども, | 嗯,刚刚我们针对商品的组合,讲了一些内容。 | うーん,さっき商品の組みあわせについて,少し話しました。 | ||
| 226 | パターンにはもちろん,いろんなものがあって,商品だけではないです。 | 但是其实还有很多其它的东西,不只是商品。 | でも実はまだほかにたくさんのものがあって,商品だけではないんです。 | ||
| 227 | たとえばソーシャルネットワークの部分グラフっていうのは, | 呃,比如说,社交网络的,嗯,嗯,一部分的图。 | えー,たとえば,ソーシャルネットワークの,うーん,うーん,一部の図です。 | ||
| 228 | あのまあ,友だちかどうかで線を引いていくと,その友人関係みたいのが,いわゆるグラフと呼ばれる構造で表現できるわけですけど, | 呃,就是,是不是朋友,我们把是不是朋友,呃,这件事用线连接起来,然后做成这种图像的形式。 | えー,友だちかどうか,私たちは友だちかどうかを,えー,このことを線で繋げて,そしてこのような画像の形式を作ります。 | ||
| 229 | それの部分的な構造っていうのを見てくるっていうのもパターンを調べるということに対応しますし, | 嗯,我们看它其中一部分的东西也是属于找出模式。 | うーん,その中の一部分のものを見るのもパターンを見つけ出すことになります。 | ||
| 230 | 分子の部分構造,分子っていうのもグラフ的な構造を持っているので, | 嗯,这里是分子的,一部分的构造,这个呢,也是,嗯,图像。 | うーん,ここは分子の,一部分の構造,というものも,うーん,画像です。 | ||
| 231 | その分子の部分的な構造を探してくる,まあそういったものもパターンの解析というふうに捉えることができます。 | 嗯,这个看分子的一部分的构造,也是属于,嗯,模式解析。 | うーん,この分子の一部分の構造を見ることも,うーん,パターン解析です。 | ||
| 232 | それからDNAみたいな,こういう文字列ですね,部分列,で,そういうところから部分列をとってくるっていうのも一種のパターンマイニングですし, | 再比如说,DNA的,嗯,这种文字,看它中间一部分也是属于,呃,模式解析。 | またたとえば,DNAの,うーん,このような文字,その中間の一部分を見るのも,えー,パターン解析です。 | ||
| 233 | まあ画像に対しても実はおんなじような考えかたをすることができます。 | 看图其实也是一种模式解析。 | 画像を見るのも実は一種のパターン解析です。 | ||
| 234 | まあ,画像についてもう少し詳しく見てみますと, | 我们现在具体看一下图像。 | 今具体的に画像を見てみましょう。 | ||
| 235 | たとえばこれは4掛ける4の白黒画像,まあ今どきこんな小さい画像っていうのはないと思うんですけど, | 嗯,比如说这里现在是四乘四的,白,嗯,白色和K色的图像。嗯,虽然现在这种比较小的图应该是没有, | うーん,たとえばここで今4賭ける4の,白,うーん,白と黒の画像です。うーん,今はこういう小さい画像は恐らくありませんが, | ||
| 236 | まああの,こういう簡単な例を使ってみましょう。 | 总之我们先看一下这个简单的例子吧。 | とにかくまずこの簡単な例を見てみましょう。 | ||
| 237 | で,白か黒かしかないので,こんな感じ,1個ずつの四角っていうのは,それぞれピクセルに対応してます。 | 嗯,这里面只有K色和白色的格子。然后后面那句话我就没有听懂。 | うーん,この中に黒と白の格子だけあります。そしてあとの話は聞き取れませんでした。 | ||
| 238 | で,この画像を,こういう文字列としても表現できますよっていう話なんですけど, | 这个图像其实也是可以用文字来表示的。 | この画像は実は文字を使って表示することもできます。 | ||
| 239 | 結局このピクセルに,まあそれぞれたとえば番号を振ってあげて, | 呃,比如说我们在每一个框里边标上数字。 | えー,たとえばそれぞれの枠の中に数字を振ります。 | ||
| 240 | 今の場合4掛ける 4なので1から16まで。 | 因为是四乘四,所以是一到十六。 | 4賭ける4なので,1から16までです。 | ||
| 241 | で,この1から16までを単に横に,白だったら0,黒だったら1っていうふうに書き並べたのがこの右側の表現です。 | 然后我们将一到十六,去排列再将,白色的是零,K色的是一,这样子去排列就得出了右面的图。 | そして1から16まで,並べて,白は0,黒は1,というように並べると右の図が得られます。 | ||
| 242 | ま,こういうふうにしてあげると,まあ画像って言っても結局,0と1の列,16個0と1が繋がった列として扱うことができて, | 如果是这样子的话,左边的图,其实也就是,嗯,变成了零和一这样子的一个文字。 | もしこのようにすると,左の図は,実は,うーん,0と1という文字に変わります。 | ||
| 243 | まあやっていることは,さっきの商品の組みあわせを調べてたときと,まあまったく同じっていうふうに考えることができます。 | 那我们现在在做呢,在做的事呢,其实是跟刚刚,嗯,商品的那件事是一样的。 | では私たちが今,していることは,実はさっきの,うーん,商品のあのことと同じなんです。 | ||
| 244 | たとえば1のピクセルっていうのはパンだったとか,2のピクセルは卵みたいな,さっきは,さっきだったらスーパーマーケットの商品ですし,今だったらこのピクセルと,そういうふうに対応していて, | 嗯,像刚刚的话呢,就是,一是面包,二是,呃,鸡蛋,这样子的一个排列,然后到这里呢,就变成了白色的是零,K色的是一的这样子的一个情况。 | うーん,さっきのような場合は,1はパン,2は,えー,卵,という配列で,そしてここでは,白は0,黒は1という状況に変わりました。 | ||
| 245 | たとえばこの領域が3つ黒ですとかっていうのは,結局この10,11,12の部分が,あの,まあ全部が黒,というふうにそういうパターンを考えるということに対応してます。 | 如果是我们看十,十一,十二,这三个,呃,框的话,其实就是右面的,嗯,十,十一,十二的这个部分。 | もし10,11,12,この3つの,えー,枠を見るなら,実は右の,うーん,10,11,12という部分です。 | ||
| 246 | ピクセルというのは,結局なんのことを言っているのでしょうか。 | ||||
| 247 | 我,这个词我不知道是什么意思,但我觉得应该是,就是单元格吧。就是「クロス[日本語で発話する]」?嗯,框框。 | この単語はどういう意味か知りませんが,たぶん,セルだと思います。「クロス」?うーん,四角い枠です。 | |||
| 248 | それがわかったのはどこからでしょうか。先生の説明でしょうか。それともピクセルという音でしょうか。 | ||||
| 249 | 嗯,因为他一直在讲「ピクセル[日本語で発話する]」的,我,我也是从它的前后文推测出来的。 | うーん,ずっと「ピクセル」と言っていたので,その前後の文から推測しました。 | |||
| 250 | パターンマイニングという意味がわかりにくいということでしたね。でも,だんだんわかってきているように思うのですが,パターンマイニングというのは結局なんだったのでしょうか。 | ||||
| 251 | 应该就是模式解析吧。 | パターン解析だと思います。 | |||
| 252 | 先生は,今回はどんな解析をしていたのでしょうか。 | ||||
| 253 | 啊,嗯,就是,找出不一样的模式,比如说,买了一个商品的,和同时买了两个商品的,和同时买了三个商品的这样子的模式。 | ああ,うーん,違うパターン,たとえば,1つの商品を買ったのと,同時に2つの商品を買ったのと,同時に3つの商品を買ったのというパターンを見つけることです。 | |||