辞書からの単語書き出し作業途中経過

辞書からSVL未収録語を抜き出す作業ですが、ようやく1,000語に達したので途中経過を報告します。
まず、おさらい。
私が今回利用している辞書は
ニュービクトリーアンカー英和
ケンブリッジ中級英英辞典
の2点です。
並行させるのは手間なのでお勧めしません。やっておいてなんですが。

さて、せっかく迎えた区切りですので、ひとまず仮称extended vocabulary list 、略称をXVLと定めます。
そして、最初の1,000語をXVL13と呼ぶことにします。
SVLから引き続き、語彙力を高めようという意思を込めました。

また、無かったことにされたらしい熟語版SILに相当する、XIL を作ります。
現時点で898個、最終的に約9,000-10,000個が集まる見込みです。
ただし、選定基準はさらに曖昧で、いわゆる熟語や、for や to と組み合わせた際の例文なども含みます。
それでもやるのは、英検1級の語彙問題に登場する熟語部分4問の対策になる、という淡い期待と、
まぁこれくらいは暗記しようという判断からです。

ところで使用中の辞書ですが、それぞれ公称項目数または、ネット上の情報では52,000と35,000とされています。
2月にはじめて、7月までの5ヶ月で進んだのは
CIEDで68ページちょい、NVAで132ページちょいです。途中、転職のごたごたで作業が止まっていたので、実質は4ヶ月と思います。
2冊合わせた語彙の数量ですが、CIED基準で1ページあたり約*14語以上を抜き出せた計算です。*語数はNVAとの合算
で、予測では11,500語が全体で抜き出せるだろうと思われます。
また、CILD単独の場合6,000語、NVAで9,000語が抜き出せると予測されます。
よって、CILDは単語のレベルとしては18,000語レベルまで収録、NVAは21,000語レベルまで収録、
2冊を併せる事で、23,500語相当のリストを作成できることになります。*なお、収録語は実際に辞書に収録されている語数ではなく、SVLに含まれない語数+12000で計算しています。SVLに含まれていて、各辞書に含まれない言葉を確認していないからです。*
XVL13.png
↑ エクセルでの作業の様子。誤差も考え、予測値は若干少なめに見積もってます。
- 数字はH(I)からページ数、ページあたり単語数、抜き出せる合計予測数、同各辞書予測数。左の数は各辞書から抜き出した数
- 緑がCILD 燈がNVA

何で公称数から減ってるのーと叫びたくなりますが、辞書の収録語数は、我々が想像する単語というものを基準に計測していないようです。
例えば、見出し語の横に派生語として名詞形、形容詞形、副詞形、熟語など並んでますが、それをどう数えているのか不明です。
同一つづりの異なる品詞形もあります、bite, better, bitch って品詞複数あるんですってよ。それって1語?
品詞以外も過去、現在、など動詞の時制変化も1語?
また、固有名詞、人名、接尾辞/接頭辞が見出し語になっているが、それを数えているのか。
それは語彙力測定サイトの判定対象になるのか。
また、birth certificate や air base など、単語の組み合わせで意味が予測できる言葉も見出し語になっていたりします。
など、まぁいろいろ、独自の計算で加算されているようであり、また、語彙力測定サイトと基準も違うようである、と言えるかと思います。

そして、こうしたものは、(まぁ、ものによっては)アルクのSVLには含まれていません。
そのための自作XVLなのですが、そうすると、例えば語彙力測定サイトでのxx,xxx語だとかと、私が苦労して作って暗記しようとしているリストの語数は、基準が合致しません。
基準がないと、最終目標が設定できません。
では、何を基準とするか。
そのために、情報を集め、自力で検討する必要があります。

スポンサーサイト

web拍手 by FC2

参加しています にほんブログ村 英語ブログ 英語学習記録へ よろしければクリックを

2016/08/07 22:15 | ボキャビルCOMMENT(0)TRACKBACK(0)  TOP

ボキャビル経過報告

約1年前に語彙力対策に力を入れ始め、余裕のある時は経過を報告してきましたが、最近滞っていました。
一旦中間報告としてまとめます。
計測は書きサイトで行っています。
http://testyourvocab.com/
http://my.vocabularysize.com/
20160731.png
開始時約6,000 - 半年後9,000前後、その後横這い
といった結果でした。
時事英語がだいぶ聞きやすく/読みやすくなりましたが、実感としても、(C2を目指すという)資格対策としても、
もう少しほしいところです。
SVLの11、12の暗記に差し掛かってペースとやる気が低下し、転職ですっかりサボり、といったこともありますので、
後半の横這いの原因は自身の学習態度にあり、学習方法の問題とは言えない、と考えます。

おさらいですが、手法に関しては
10ヵ月やってみた を参考に、PSSにSVLをぶっこんでひたすら暗記
多読多チョウでおさらい+補強
今後に関しては
SVL以降については、辞書暗記を目指す
ただし、状況を見るに、SVL 9 10 11 に問題あると思われ。要復習。
といった感じです。

現在は英検1級の取得を目指していますが、
推定では、語彙力12,000未満では、取得は不可能だろうと思っています。
現に、C2の英検コンペでも私の結果は合格ラインを割っています。
転職前は1月の受験を目指していましたが、どうも数字が追いついていないようです。
もう少し経過を見て、今後の予定を考えたいと思います。

web拍手 by FC2

参加しています にほんブログ村 英語ブログ 英語学習記録へ よろしければクリックを

2016/08/03 22:28 | ボキャビルCOMMENT(0)TRACKBACK(0)  TOP

3月ボキャビル報告

しばらく公表する気力が無かったのですが、なんとか数か月分まとめてご報告。
約8ヵ月が経過(7月末-03/31)したため、恒例の、語彙力診断をやってみました。
http://testyourvocab.com
6180>7090>7720>7940>8270>9620>8700>8850>9790
http://my.vocabularysize.com/
6400>6900>7300>8200>8400>8800>9100>9000>9400
途中で乱高下して、もう公表する気力もなくなりますが、
全体的に見渡すと、語彙力は増えたということです(本当かよ)。
201604voc.png
8ヶ月で約3200増えてますので、月400のペースです。
このペースを保っても、C2レベルにいつ到達するのか分かりません。
そろそろ、英検1級合格程度(C1相当)が見えてくるころだと思うのですが。
あまり考えるとゲンナリするので、あまり深く考えずに続けていこうと思います。

web拍手 by FC2

参加しています にほんブログ村 英語ブログ 英語学習記録へ よろしければクリックを

2016/03/31 22:48 | ボキャビルCOMMENT(2)TRACKBACK(0)  TOP

ボキャビル経過12月

約4ヵ月が経過(7月末-12/28)したため、恒例の、語彙力診断をやってみました。
http://testyourvocab.com
6180>7090>7720>7940>8270>9620
http://my.vocabularysize.com/
6400>6900>7300>8200>8400>8800
前月比で平均を取ると、8300から9200に、900語増えたらしい、ということです(本当かよ)。

やはり誤差があるようで、前月伸びが悪く、今月は異常な伸びを記録しました。
2ヶ月の伸びを平均すると500語強なので、長期的に見れば安定していると思います。

来年もこの調子で続けていきたいと思います。
皆様も実り多き、よい1年を!

web拍手 by FC2

参加しています にほんブログ村 英語ブログ 英語学習記録へ よろしければクリックを

2015/12/30 21:25 | ボキャビルCOMMENT(0)TRACKBACK(0)  TOP

PSSにネイティブ音声

気になって買いました。
http://www.takke.jp/pss/dictionary.html
現代英英辞典(oxford Advanced learner’s dictionary 8)中古です。
抽出数は約103,000件、うち45,000が例文音声だそうですので、見出し語音声は58,000未満と思われます。
無事作業が終わるか不安でしたが、ダウンロードと指示通りの作業で約1時間、無事終わりました。
聞いてみた感想は。。。すごい。合成音とは格段に違います。これならもっと早く導入すべきでした。
ただし、体感として20問中1問は音声が無いのか引き当てられないのか、合成音が出ます。
18万項目収録(上記の通り見出し語音声は58000未満と思われ)の辞典ですが、すべての語形変化や品詞違いを掲載
するには収録数が小さいのかもしれません。また、新版がすでに出ており、最近出てきた単語は収録していません
(SVLには関係なさそうですが)。
15000語を目指し、5000語レベルから始めたとしても、10000語、うち5%の音声が無いとしても
9500語の音声なら値段も妥当でしょう。(書店に流通していた時の価格は4500+税のようです)
私のクリスマスプレゼントはこれで終わりですね。サンタさんの懐は厳しいのだ。

今後の要望としては、辞書によってはブリティッシュ発音とアメリカ発音双方を収めたものもあるので、それを選択できるようになればイギリス英語対策に有用かとおもったのですが。
PSS自体の更新が2年ほど止まっているようなので、無理かなぁ。

2016/01/28追記
音声データ引き当てミスの原因

1.British とAmericanのつづりの違い
我々が使うのは通常米つづりですが、Oxfordは英つづりで音声も管理しています。米発音でもファイル名は英国式。手動でファイルを探し、PSSで編集する必要があります。抜き出したデータの中から見つけられます。
e.g. skeptical / sceptical

2.con-で始まる単語
原因不明。。。どこからか音声を入手できれば、PSSで編集してなんとかできます。

3.複合語、ハイフンのあるなし
エイジロウとOxfordで表記が違い、PSSで同じ単語と認識できないようです。
音声データを見つけられれば、手動で指定できます。

web拍手 by FC2

参加しています にほんブログ村 英語ブログ 英語学習記録へ よろしければクリックを

2015/12/18 22:44 | ボキャビルCOMMENT(1)TRACKBACK(0)  TOP

 | BLOG TOP |  NEXT»»