#corpus_proletarius
Фокус значения
термина «пролетарий» в работах К. Маркса и Ф. Энгельса (на основе анализа
коллокаций буквосочетания «*proletar*»).
Продолжаем выяснять значение термина "пролетариат"
в корпусе К. Маркса и Ф. Энгельса.
Напомним, что в данной работе первый шаг состоял в прочитывании всех конкордансов
с буквосочетанием «*proletar*» в 43-х томном собрании сочинений Маркса и
Энгельса (MEW) (звездочка указывает на любой символ в любом количестве). Впрочем, надо было делать все наоборот: сначала сгенерировать коллокации, а потом читать по ним конкордансы; это дало бы понимание специфики значения буквосочетания "*proletar*" с каждым из частотных рядоположенных слов.
Сегодня сделали второй шаг - провели анализ коллокаций
буквосочетания «*proletar*» (то есть, рядоположенных слов с искомым буквосочетанием,
которые могут указывать на его значение):
1) для определения основных тем по пролетарию в корпусе К.
Маркса и Ф. Энгельса
2) для ранжирования этих тем и выделения наиболее важных
направлений (фокуса) исследований основоположников (для этого коллокации были
сгруппированы по темам и количественно просчитаны);
Результаты второго шага также дали возможность ответить на актуальный
вопрос: «в чем отличие «пролетария» от «рабочего»?».
Например, Энгельс утверждал, что термины «пролетарий» и «рабочий»
являются синонимами в их с Марксом работах. Наш анализ показал, что есть
существенные отличия в употреблении этих терминов: политический фокус у первого
термина и экономический – у второго.
Мы приближаемся к пониманию Маркса и Энгельса, как
исследователей и участников общественных движений. На этой основе готовимся к
изучению текстов исследователей и участников современных демократических
движений.
Этапы работы:
І этап. Генерирование коллокаций с
буквосочетанием «*proletar*» (звездочка указывает на любой символ в любом
количестве). Выделение основных тем по пролетарию, которые изучались в работах
К. Маркса и Ф. Энгельса.
ІІ этап. Верификация результатов работы
на 1-ом этапе, то есть, перепроверка корректности определения тем по
пролетариату на основе генерирования коллакаций по 10 частотным словам, которые
рядоположены с буквосочетанием «*proletar*».
ІІІ этап. Обобщение: выделение фокуса
исследований пролетариата в работах К. Маркса и Ф. Энгельса.
ІV этап. Различие между буквосочетаниями
«*proletar*» и «*arbeiter*».
В данной работе не были представлены скриншоты из программы,
а предложены самостоятельно составленные таблицы с результатами работы с
программой, в которых в том числе дан перевод терминов с немецкого языка на
русский язык
Оригинальные версии результатов работы с программой по
каждому этапу можно посмотреть в Excel-формате здесь.
І этап:
Итак, генерируем коллокации в программе AntConc 3.5.9.
Постановка задачи для программы: создать список коллокаций с
буквосочетанием «*proletar*» (звездочки означают – любой символ, любое
количество). Минимальное количество – 50 раз. Диапазон 20 слов слева и справа
от буквосочетания «*proletar*». Активированы стоп-слова.
В таблице 1 можно ознакомиться с результатами генерирования
коллокаций.
Частотные слова были сгруппированы исходя из их общего
значения. Каждая группа частотных слов была отнесена к определенной теме. Темы
были самостоятельно названы. Ниже представлены основные темы по пролетарию,
частотные слова по каждой теме и их частотность.
Представленные здесь темы и частотные слова из таблицы 1,
которые соответствуют каждой теме, отмечены определенным цветом. Частотные
слова в таблице 1, которые не отмечены цветом, соответственно не учитывались в
данной работе, из-за сложности их отнесения к определенной теме.
1. Национальный характер пролетариата –
соответствие с темой, выделенной при чтении конкордансов (16 слов: немецкий, Германия,
парижский, Франция, страны, Англия, Французский, английский, Международный, Немецкий,
Париж, Мир, страны, Европейский, английский, Международный,Французский);
2. Пролетарское сознание и политическая
репрезентация – соответствие с темой, выделенной при чтении
конкордансов (15 слов – революция, движение, Политическая партия, господство, политический,
политический, борьба, революционер, Интересы, победа, организация, коммунисты, социализм,
противопоставление, революционер);
3. Социальные категории -
несоответствие (11 слов – общество, класс, классы, труд, развитие, республика, современный,
правительство, интерес, развитый, Социальное);
4. Пролетариат – определение – частичное
соответствие с темой, выделенной при чтении конкордансов (синонимы
пролетариата?) (8 слов: пролетариат, рабочие, пролетарский, пролетариат, масса,
Рабочий класс, рабочие, народ);
5.
Экономическое положение пролетариата
– соответствие с темой, выделенной при чтении конкордансов (8 слов: труд, Промышленность,
промышленный, условия, капитал, конкурент, производство, промышленный);
6. Отношения
пролетариата с другими классами – частичное соответствие с темой «Пролетаризация и классовая борьба между
пролетариатом и буржуазией» (только буржуазия) (5 слов: буржуазия, буржуазный
(+burgerlich), фермеры,
мелкий буржуа).
Таблица 1 Результаты генерирования коллокаций с буквосочетанием
«*proletar*» по корпусу собрания сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
1 |
655 |
329 |
326 |
25.57632 |
bourgeoisie |
буржуазия |
2 |
280 |
131 |
149 |
16.72508 |
proletariat |
пролетариат |
3 |
243 |
115 |
128 |
15.50947 |
arbeiter |
рабочие |
4 |
240 |
102 |
138 |
15.46053 |
revolution |
революция |
5 |
238 |
120 |
118 |
15.38321 |
gesellschaft |
общество |
6 |
235 |
128 |
107 |
15.30998 |
klasse |
класс |
7 |
235 |
97 |
138 |
15.29495 |
bewegung |
движение |
8 |
213 |
91 |
122 |
14.56587 |
partei |
Политическая партия |
9 |
173 |
90 |
83 |
13.13387 |
klassen |
классы |
10 |
159 |
70 |
89 |
12.60421 |
proletarier |
пролетарский |
11 |
149 |
94 |
55 |
12.19914 |
proletariats |
пролетариат |
12 |
150 |
105 |
45 |
12.19296 |
deutschen |
Немецкий |
13 |
138 |
76 |
62 |
11.73166 |
bourgeois |
буржуазный |
14 |
138 |
88 |
50 |
11.72985 |
herrschaft |
господство |
15 |
128 |
53 |
75 |
11.12898 |
arbeit |
труд |
16 |
116 |
61 |
55 |
10.74775 |
politische |
политический |
17 |
116 |
72 |
44 |
10.74076 |
industrie |
Промышленность |
18 |
116 |
47 |
69 |
10.73932 |
politischen |
политический |
19 |
114 |
67 |
47 |
10.65372 |
kampf |
борьба; война |
20 |
113 |
49 |
64 |
10.58090 |
deutschland |
Германия |
21 |
107 |
52 |
55 |
10.32310 |
bürgerlichen |
буржуазный |
22 |
101 |
78 |
23 |
10.03285 |
pariser |
парижский |
23 |
97 |
56 |
41 |
9.81030 |
entwicklung |
развитие |
24 |
96 |
51 |
45 |
9.74458 |
frankreich |
Франция |
25 |
95 |
59 |
36 |
9.73410 |
revolutionären |
революционер |
26 |
94 |
48 |
46 |
9.65906 |
masse |
масса |
27 |
93 |
29 |
64 |
9.63294 |
länder |
страны |
28 |
91 |
47 |
44 |
9.52141 |
republik |
республика |
29 |
90 |
48 |
42 |
9.47107 |
interessen |
Интересы |
30 |
91 |
40 |
51 |
9.46926 |
england |
Англия |
31 |
90 |
58 |
32 |
9.43828 |
französischen |
Французский |
32 |
88 |
49 |
39 |
9.35616 |
bauern |
фермеры |
33 |
87 |
54 |
33 |
9.27406 |
englischen |
английский |
34 |
85 |
44 |
41 |
9.19201 |
internationale |
Международный |
35 |
84 |
41 |
43 |
9.15216 |
sieg |
победа |
36 |
84 |
37 |
47 |
9.11626 |
alten |
Старый |
37 |
82 |
42 |
40 |
9.03555 |
organisation |
организация |
38 |
81 |
58 |
23 |
8.98379 |
modernen |
современный |
39 |
78 |
36 |
42 |
8.82178 |
kommunisten |
коммунисты |
40 |
77 |
55 |
22 |
8.73948 |
deutsche |
Немецкий |
41 |
76 |
54 |
22 |
8.69904 |
industriellen |
промышленный |
42 |
77 |
36 |
41 |
8.69895 |
regierung |
правительство |
43 |
75 |
53 |
22 |
8.64016 |
gegensatz |
противопоставление |
44 |
75 |
36 |
39 |
8.63464 |
interesse |
интерес |
45 |
73 |
47 |
26 |
8.48888 |
paris |
Париж |
46 |
72 |
34 |
38 |
8.43535 |
welt |
Мир |
47 |
69 |
33 |
36 |
8.28540 |
entwickelt |
развитый |
48 |
66 |
36 |
30 |
8.09733 |
bedingungen |
условия |
49 |
62 |
31 |
31 |
7.85766 |
ländern |
страны |
50 |
60 |
30 |
30 |
7.71350 |
juni |
июнь |
51 |
60 |
32 |
28 |
7.69928 |
fast |
Около |
52 |
59 |
30 |
29 |
7.66318 |
sozialismus |
социализм |
53 |
59 |
32 |
27 |
7.65233 |
arbeiterklasse |
Рабочий класс |
54 |
59 |
29 |
30 |
7.65120 |
arbeitern |
рабочие |
55 |
58 |
34 |
24 |
7.57893 |
lage |
вопрос |
56 |
57 |
30 |
27 |
7.52416 |
stellung |
позиция |
57 |
59 |
28 |
31 |
7.48109 |
kapital |
капитал |
58 |
56 |
27 |
29 |
7.45429 |
verschiedenen |
разные |
59 |
56 |
29 |
27 |
7.44301 |
volk |
народ |
60 |
55 |
35 |
20 |
7.40218 |
revolutionäre |
революционер |
61 |
55 |
40 |
15 |
7.39905 |
europäischen |
Европейский |
62 |
55 |
32 |
23 |
7.38391 |
englische |
английский |
63 |
54 |
27 |
27 |
7.34380 |
kleinbürger |
мелкий буржуа |
64 |
54 |
30 |
24 |
7.32163 |
internationalen |
Международный |
65 |
52 |
22 |
30 |
7.19416 |
sozialen |
Социальное |
66 |
52 |
31 |
21 |
7.18367 |
konkurrenz |
конкурент |
67 |
51 |
21 |
30 |
7.11643 |
solange |
пока |
68 |
51 |
34 |
17 |
7.11032 |
französische |
Французский |
69 |
52 |
21 |
31 |
7.10945 |
produktion |
производство |
70 |
51 |
23 |
28 |
7.10064 |
eignen |
подходящее |
71 |
50 |
33 |
17 |
7.05757 |
industrielle |
промышленный |
72 |
50 |
23 |
27 |
7.03580 |
augenblick |
момент |
ІІ этап:
На основе результатов 1-го этапа работы, были сгенерированы
коллокации по 10 самым частотным словам, которые рядоположены с буквосочетанием
«proletar». Эта работа дала возможность верифицировать результаты работы на
1-ом этапе, то есть, перепроверить корректность определения тем по
пролетариату.
Постановка задачи для программы: создать список коллокаций
по следующим словам «bourgeoisie» (bourgeois, bourgeoisie, bürgerlichen), «revolution»,
«gesellschaft», «klasse», «bewegung», «partei», «deutschen», «herrschaft»,
«arbeit», «politische» (эти слова можно посмотреть в таблице 1 – первые 10
частотных слов). Исключались синонимы и аналогичные слова, искомые слова с мн.
числом со словом «пролетарий» из списка сгенерированных коллокаций.
Минимальное количество – 10 раз. Диапазон 20 слов слева и
справа. Активированы стоп-слова.
В представленных ниже таблицах 2-11 можно ознакомиться с
результатами генерирования коллокаций по каждому частотному слову.
Таблица 2 Результаты
генерирования коллокаций «bourgeoisie (bourgeois, bourgeoisie, bürgerlichen)» с буквосочетанием «*proletar*» по корпусу собрания сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
3 |
107 |
47 |
60 |
10.32634 |
proletariat |
пролетариат |
5 |
97 |
50 |
47 |
9.75566 |
gesellschaft |
общество |
6 |
90 |
50 |
40 |
9.44377 |
klasse |
класс |
9 |
62 |
35 |
27 |
7.83122 |
kampf |
борьба |
10 |
62 |
25 |
37 |
7.66274 |
arbeiter |
рабочие |
11 |
59 |
36 |
23 |
7.64501 |
herrschaft |
господство |
12 |
58 |
37 |
21 |
7.49739 |
deutschen |
Немецкий |
13 |
52 |
23 |
29 |
7.11996 |
revolution |
революция |
15 |
46 |
35 |
11 |
6.74767 |
gegensatz |
противопоставление |
16 |
44 |
24 |
20 |
6.52471 |
bewegung |
Движение |
Очевидно, что частотное слово «буржуазия»,
которое встречается со словом пролетариат, указывает на политические отношения
с буржуазии пролетариатом: отсюда, борьба, противостояние, господство,
революция, движение. Поэтому термин «bourgeoisie» относится к политическому
измерению пролетариата.
Таблица 3. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «revolution» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
40 |
14 |
26 |
6.23355 |
bourgeoisie |
буржуазия |
3 |
31 |
14 |
17 |
5.40291 |
gesellschaft |
общество |
4 |
20 |
9 |
11 |
4.43111 |
proletariat |
пролетариат |
5 |
20 |
13 |
7 |
4.38078 |
klasse |
класс |
7 |
17 |
10 |
7 |
4.08144 |
europaischen |
Европейский |
8 |
16 |
8 |
8 |
3.93062 |
herrschaft |
господство |
9 |
16 |
9 |
7 |
3.91787 |
politische |
политический |
11 |
16 |
6 |
10 |
3.85878 |
partei |
Политическая партия |
12 |
15 |
4 |
11 |
3.83143 |
sieg |
победа |
13 |
14 |
8 |
6 |
3.66145 |
franzosische |
Французский |
Таблица 4 Результаты генерирования коллокаций буквосочетания «*proletar*»с буквосочетанием «*gesellschaft*» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
70 |
36 |
34 |
8.35860 |
bourgeoisie |
буржуазия |
4 |
33 |
13 |
20 |
5.73126 |
revolution |
революция |
5 |
28 |
13 |
15 |
5.28253 |
klasse |
класс |
7 |
25 |
10 |
15 |
4.99573 |
proletariat |
пролетариат |
8 |
25 |
13 |
12 |
4.98593 |
alten |
Старый |
9 |
21 |
14 |
7 |
4.57554 |
herrschaft |
господство |
11 |
19 |
14 |
5 |
4.35709 |
befreiung |
освобождение |
13 |
18 |
6 |
12 |
4.16528 |
arbeit |
труд |
14 |
16 |
11 |
5 |
3.99427 |
modernen |
современный |
15 |
14 |
8 |
6 |
3.71929 |
bewegung |
Движение |
Очевидно, что
коллокация «gesellschaft» имеет то же политическое звучание (а не сугубо
социально-теоретическое), поскольку ее коллокациями являются «революция»,
«старый», «современный», «движение», «господство», «освобождение». Поэтому
«gesellschaft» относится к политическому измерению пролетариата.
Таблица 5. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «*klasse*» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
70 |
34 |
36 |
8.35860 |
bourgeoisie |
буржуазия |
3 |
42 |
19 |
23 |
6.47745 |
proletariat |
пролетариат |
5 |
23 |
11 |
12 |
4.77359 |
gesellschaft |
общество |
6 |
21 |
8 |
13 |
4.51095 |
arbeit |
Работа |
7 |
20 |
11 |
9 |
4.45342 |
bewegung |
движение |
8 |
20 |
11 |
9 |
4.42890 |
arbeiter |
рабочие |
9 |
18 |
12 |
6 |
4.23504 |
herrschaft |
господство |
10 |
18 |
7 |
11 |
4.22463 |
revolution |
революция |
13 |
17 |
12 |
5 |
4.11097 |
industrie |
Промышленность |
14 |
16 |
11 |
5 |
3.99021 |
kampf |
борьба |
Очевидно, что
коллокация «klasse» имеет то же политическое звучание, как и в случае с
«gesellschaft». Поэтому «klasse» относится к политическому измерению
пролетариата.
Таблица 6 Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «bewegung» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
26 |
10 |
16 |
4.92961 |
bourgeoisie |
буржуазия |
3 |
23 |
9 |
14 |
4.75855 |
kommunisten |
коммунисты |
4 |
23 |
11 |
12 |
4.73259 |
interessen |
Интересы |
6 |
22 |
11 |
11 |
4.50966 |
partei |
Политическая партия |
7 |
20 |
10 |
10 |
4.45804 |
proletarischen |
пролетарский |
8 |
21 |
10 |
11 |
4.44877 |
klasse |
класс |
10 |
20 |
12 |
8 |
4.16957 |
deutschen |
Немецкий |
11 |
17 |
12 |
5 |
4.03791 |
übrigen |
остальной, лишний |
14 |
16 |
11 |
5 |
3.90598 |
stellen |
ставить |
15 |
15 |
8 |
7 |
3.76973 |
internationalen |
Международный |
Очевидно, что коллокация «bewegung» (движение) имеет то же
политическое звучание, как и в случае с «gesellschaft», как мы изначально
предположили.
Таблица 7. Результаты генерирования коллокаций буквосочетания «*proletar*»с буквосочетанием «partei» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
23 |
9 |
14 |
4.77838 |
bewegung |
Движение |
3 |
22 |
13 |
9 |
4.67615 |
bourgeoisie |
буржуазия |
4 |
19 |
8 |
11 |
4.35401 |
proletariat |
пролетариат |
5 |
17 |
7 |
10 |
4.11384 |
politische |
политический |
6 |
16 |
11 |
5 |
3.99514 |
revolutionären |
революционер |
8 |
14 |
10 |
4 |
3.73113 |
klassen |
классы |
9 |
14 |
5 |
9 |
3.72285 |
alten |
Старый |
10 |
14 |
10 |
4 |
3.71314 |
gesellschaft |
общество |
12 |
13 |
5 |
8 |
3.60249 |
demokratischen |
демократичный |
13 |
13 |
6 |
7 |
3.60171 |
kommunisten |
коммунисты |
Таблица 8. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «deutschen» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
38 |
18 |
20 |
6.07105 |
bourgeoisie |
буржуазия |
4 |
18 |
10 |
8 |
4.19939 |
proletariat |
пролетариат |
5 |
18 |
7 |
11 |
4.13629 |
politischen |
политический |
6 |
18 |
10 |
8 |
4.07295 |
bewegung |
Движение |
8 |
15 |
13 |
2 |
3.71229 |
französischen |
Французский |
11 |
9 |
4 |
5 |
2.99958 |
athletengestalt |
фигура спортсмена |
12 |
10 |
2 |
8 |
2.95444 |
revolution |
революция |
13 |
9 |
4 |
5 |
2.95347 |
länder |
страны |
14 |
10 |
3 |
7 |
2.94981 |
englischen |
английский |
15 |
8 |
7 |
1 |
2.75875 |
modernen |
современный |
Скорее, это слово тяготеет к политическому измерению,
учитывая коллокации.
Таблица 9. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «herrschaft» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
66 |
33 |
33 |
8.05319 |
bourgeoisie |
буржуазия |
3 |
24 |
14 |
10 |
4.83192 |
politische |
политический |
4 |
22 |
10 |
12 |
4.49473 |
gesellschaft |
общество |
5 |
19 |
6 |
13 |
4.31680 |
proletariat |
пролетариат |
7 |
17 |
10 |
7 |
4.02401 |
klasse |
класс |
8 |
17 |
10 |
7 |
3.96370 |
revolution |
революция |
10 |
13 |
9 |
4 |
3.35551 |
deutschen |
Немецкий |
11 |
12 |
3 |
9 |
3.30103 |
partei |
Политическая партия |
15 |
10 |
7 |
3 |
3.06738 |
französische |
Французский |
16 |
9 |
6 |
3 |
2.96475 |
demokratie |
демократия |
Таблица 10. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «arbeit» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
23 |
11 |
12 |
4.73278 |
klasse |
класс |
3 |
24 |
11 |
13 |
4.58532 |
kapital |
капитал |
4 |
17 |
8 |
9 |
4.10686 |
proletarier |
пролетарский |
5 |
17 |
9 |
8 |
3.95833 |
gesellschaft |
общество |
6 |
15 |
6 |
9 |
3.76299 |
bourgeoisie |
буржуазия |
8 |
10 |
6 |
4 |
3.11439 |
existenz |
существование |
10 |
8 |
4 |
4 |
2.76329 |
bourgeois |
буржуазный |
11 |
8 |
4 |
4 |
2.75170 |
bedingungen |
условия |
12 |
8 |
4 |
4 |
2.75159 |
schließlich |
в конце концов |
14 |
8 |
4 |
4 |
2.72545 |
eignen |
подходящее |
Очевидно экономический фокус существования пролетариата.
Таблица 11. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «politische» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
частотное слово |
перевод |
2 |
48 |
25 |
23 |
6.91855 |
bourgeoisie |
буржуазия |
3 |
29 |
19 |
10 |
5.37917 |
herrschaft |
господство |
4 |
21 |
5 |
16 |
4.56825 |
partei |
Политическая партия |
6 |
16 |
7 |
9 |
3.98813 |
klasse |
класс |
7 |
14 |
3 |
11 |
3.72124 |
revolution |
революция |
8 |
14 |
7 |
7 |
3.71929 |
bewegung |
Движение |
9 |
13 |
4 |
9 |
3.59964 |
proletariat |
пролетариат |
10 |
12 |
5 |
7 |
3.45596 |
organisation |
организация |
12 |
11 |
5 |
6 |
3.30836 |
gewalt |
насилие |
13 |
10 |
3 |
7 |
3.13628 |
deutschland |
Германия |
ІІІ этап
Итак, анализ коллокаций 10 частотных слов с буквосочетанием «proletar»
уточнил понимание этого термина: фокус Маркса и Энгельса на политической борьбе
пролетариата с буржуазией в разных странах, организации этой борьбы. Упоминание
общих социальных категорий, национальностей и классов связано с политической
борьбой, поэтому выделение этих тем было ошибочным.
Для понимания разности
значений пролетария с каждым частотным словом, необходимо читать конкордансы и
создавать концептуальные карты. Для распознавания общественного бытия
пролетария, необходимо читать конкордансы по буржуазии, движению, партии и т.д.
Вот таким же образом мы будем изучать тексты исследований и деятелей
общественных, демократических движений современности.
ІV этап
Напрашивается вопрос: есть ли различие между пролетарием и
рабочим или рабочим классом?
Предположим, что пролетариат – это определение политическое,
а рабочий (рабочий класс и все другие формы) – экономическое. Как это
проверить? Сгенерировать коллокации по буквосочетанию «*arbeiter*» («arbeiter»
является третьим по частотности словом в корпусе – встречается 7960 раз; более
чем в 2 раза больше, чем пролетарий; это мы не говорим о другим словоформах
«arbeiter»).
Постановка задачи для программы: создать список коллокаций с
буквосочетанием «*arbeiter*» (звездочки означают – любой символ, любое
количество). Минимальное количество – 72 раза. Диапазон 20 слов слева и справа
от буквосочетания «*arbeiter*». Активированы стоп-слова.
В таблице 12 можно ознакомиться с результатами генерирования
коллокаций с буквосочетанием «*arbeiter*».
Проверим коллокации на
соответствие теме «Экономическое положение пролетариата», чтобы проверить наше
предположение. Другими словами, выделим частотные слова, которые соответствуют экономической
тематике. В таблице 12 такие слова отмечены серым цветом.
Таблица 12. Результаты генерирования коллокаций буквосочетания «*proletar*» с буквосочетанием «*arbeiter*» по корпусу собрания
сочинений Маркса и Энгельса
№ |
всего |
слева |
справа |
t-score |
Частотные слово |
перевод |
1 |
3500 |
1694 |
1806 |
58.77820 |
arbeiter |
рабочие |
2 |
3233 |
1657 |
1576 |
56.18378 |
arbeit |
Работа |
3 |
1706 |
862 |
844 |
40.61984 |
kapital |
капитал |
4 |
1191 |
565 |
626 |
34.32457 |
kapitalisten |
капиталисты |
5 |
923 |
378 |
545 |
29.70682 |
wert |
стоимость |
6 |
847 |
636 |
211 |
28.97869 |
internationalen |
Международный |
7 |
770 |
555 |
215 |
27.30679 |
deutschen |
Немецкий |
8 |
755 |
403 |
352 |
26.97938 |
kapitals |
капитал |
9 |
689 |
350 |
339 |
25.88048 |
verhältnis |
отношение |
10 |
653 |
368 |
285 |
25.42734 |
kapitalist |
капиталист |
11 |
653 |
355 |
298 |
25.24740 |
bourgeoisie |
буржуазия |
12 |
641 |
321 |
320 |
24.78572 |
produktion |
производство |
13 |
626 |
313 |
313 |
24.62846 |
bewegung |
движение |
14 |
604 |
321 |
283 |
24.40436 |
arbeitern |
рабочие |
15 |
593 |
313 |
280 |
24.18449 |
arbeiterklasse |
Рабочий класс |
16 |
592 |
281 |
311 |
24.00779 |
produkt |
продукт |
17 |
568 |
396 |
172 |
23.44915 |
englischen |
английский |
18 |
559 |
210 |
349 |
23.43006 |
stunden |
часы |
19 |
537 |
333 |
204 |
22.97189 |
internationale |
Международный |
20 |
533 |
272 |
261 |
22.54583 |
gesellschaft |
общество |
21 |
532 |
272 |
260 |
22.49690 |
etc |
И т.д |
22 |
517 |
260 |
257 |
22.19674 |
england |
Англия |
23 |
497 |
268 |
229 |
22.02831 |
arbeitszeit |
рабочее
время |
24 |
511 |
215 |
296 |
21.80891 |
london |
Лондон |
25 |
481 |
241 |
240 |
21.74812 |
arbeitslohn |
заработная
плата |
26 |
468 |
154 |
314 |
21.42089 |
arbeiten |
Работа |
27 |
458 |
239 |
219 |
21.14117 |
klasse |
класс |
28 |
433 |
233 |
200 |
20.60217 |
maschinerie |
машины |
29 |
426 |
204 |
222 |
20.54429 |
lohn |
оплата
труда |
30 |
430 |
263 |
167 |
20.42447 |
masse |
масса |
31 |
435 |
232 |
203 |
20.23603 |
form |
форма |
32 |
419 |
254 |
165 |
20.21749 |
lage |
вопрос |
33 |
420 |
153 |
267 |
20.18629 |
leben |
Жизнь |
34 |
406 |
196 |
210 |
19.99646 |
arbeitskraft |
Рабочая
сила |
35 |
395 |
221 |
174 |
19.76945 |
lebensmittel |
жизненные
средства |
36 |
402 |
138 |
264 |
19.62957 |
erhalten |
Получать |
37 |
376 |
130 |
246 |
19.27164 |
assoziation |
ассоциация |
38 |
379 |
187 |
192 |
19.11196 |
usw |
и т.д |
39 |
365 |
177 |
188 |
18.92770 |
bourgeois |
буржуазный |
40 |
380 |
181 |
199 |
18.91885 |
ware |
товар |
41 |
368 |
183 |
185 |
18.78265 |
partei |
Политическая партия |
42 |
365 |
211 |
154 |
18.65220 |
worin |
в которой |
43 |
350 |
193 |
157 |
18.58547 |
fabrikanten |
производители |
44 |
354 |
143 |
211 |
18.53030 |
eignen |
подходящее |
45 |
348 |
223 |
125 |
18.52900 |
arbeiters |
рабочий |
46 |
354 |
174 |
180 |
18.41468 |
profit |
выгода |
47 |
354 |
162 |
192 |
18.30345 |
deutschland |
Германия |
48 |
351 |
226 |
125 |
18.28299 |
französischen |
Французский |
49 |
358 |
188 |
170 |
18.22610 |
geld |
Деньги |
50 |
341 |
183 |
158 |
18.21641 |
klassen |
отличный |
51 |
334 |
233 |
101 |
18.11338 |
anzahl |
Количество |
52 |
344 |
184 |
160 |
18.10799 |
fall |
кейс |
53 |
339 |
186 |
153 |
18.09395 |
industrie |
Промышленность |
54 |
339 |
163 |
176 |
17.94167 |
paris |
Париж |
55 |
329 |
179 |
150 |
17.89191 |
politische |
политический |
56 |
342 |
170 |
172 |
17.81730 |
of |
из |
57 |
347 |
175 |
172 |
17.75385 |
herr |
Господин |
58 |
334 |
169 |
165 |
17.72953 |
band |
Лента |
59 |
334 |
180 |
154 |
17.60474 |
regierung |
правительство |
60 |
323 |
150 |
173 |
17.48330 |
siehe |
пожалуйста, обратитесь |
61 |
312 |
158 |
154 |
17.38437 |
mehrwert |
прибавочная
стоимость |
62 |
309 |
149 |
160 |
17.31763 |
kampf |
борьба |
63 |
307 |
154 |
153 |
17.24747 |
kongreß |
съезд |
64 |
295 |
181 |
114 |
16.98467 |
zahl |
номер |
65 |
286 |
116 |
170 |
16.70791 |
produziert |
произвел |
66 |
290 |
149 |
141 |
16.55967 |
art |
искусство |
67 |
281 |
130 |
151 |
16.49011 |
andren |
разное |
68 |
296 |
138 |
158 |
16.48684 |
the |
в |
69 |
280 |
173 |
107 |
16.39112 |
deutsche |
Немецкий |
70 |
274 |
143 |
131 |
16.35350 |
organisation |
организация |
71 |
279 |
131 |
148 |
16.30374 |
andre |
разное |
72 |
282 |
146 |
136 |
16.26030 |
revolution |
революция |
Уточним поиск частотных слов по словам
arbeiter|arbeitern|arbeiters (рабочий, рабочие). Как видим (табл.13),
экономический фокус четко фиксируется при поиске буквосочетания «*arbeiter*» и
при поиске конкретных слов с обозначением рабочего. Отметим, что частотными
словами являются труд, капитал, капиталист (не буржуа!), продукт, производство,
часы, время труда, зарплата и т.д.
Таблица 13. Результаты генерирования коллокаций по словам arbeiter|arbeitern|arbeiters
(рабочий, рабочие) по корпусу собрания сочинений Маркса и Энгельса
1 |
2697 |
1289 |
1408 |
51.49680 |
arbeiter |
2 |
2694 |
1377 |
1317 |
51.16354 |
arbeit |
3 |
1408 |
704 |
704 |
36.77051 |
kapital |
4 |
946 |
434 |
512 |
30.54808 |
kapitalisten |
5 |
811 |
330 |
481 |
27.75893 |
wert |
6 |
575 |
330 |
245 |
23.84433 |
kapitalist |
7 |
568 |
317 |
251 |
23.25873 |
kapitals |
8 |
542 |
275 |
267 |
22.86561 |
verhältnis |
9 |
532 |
249 |
283 |
22.72412 |
produkt |
10 |
509 |
192 |
317 |
22.33769 |
stunden |
11 |
496 |
246 |
250 |
21.66598 |
produktion |
12 |
448 |
335 |
113 |
20.58644 |
deutschen |
13 |
434 |
237 |
197 |
20.54889 |
arbeitszeit |
14 |
428 |
238 |
190 |
20.48377 |
arbeitern |
15 |
401 |
212 |
189 |
19.63391 |
bourgeoisie |
16 |
390 |
201 |
189 |
19.54453 |
arbeitslohn |
17 |
385 |
122 |
263 |
19.38722 |
arbeiten |
18 |
353 |
171 |
182 |
18.68341 |
lohn |
19 |
349 |
196 |
153 |
18.56966 |
lebensmittel |
20 |
370 |
194 |
176 |
18.55403 |
etc |
21 |
351 |
166 |
185 |
18.13698 |
ware |
22 |
335 |
165 |
170 |
18.13459 |
arbeitskraft |
23 |
323 |
168 |
155 |
17.73313 |
maschinerie |
24 |
327 |
169 |
158 |
17.54141 |
bewegung |
25 |
317 |
113 |
204 |
17.45041 |
leben |
26 |
315 |
207 |
108 |
17.38374 |
masse |
27 |
327 |
173 |
154 |
17.36733 |
form |
28 |
318 |
168 |
150 |
17.13220 |
gesellschaft |
29 |
306 |
215 |
91 |
16.97023 |
englischen |
30 |
301 |
93 |
208 |
16.86355 |
erhalten |
31 |
296 |
145 |
151 |
16.76699 |
profit |
32 |
281 |
176 |
105 |
16.62311 |
arbeiters |
33 |
278 |
161 |
117 |
16.53553 |
fabrikanten |
34 |
299 |
155 |
144 |
16.53137 |
geld |
35 |
278 |
202 |
76 |
16.49545 |
anzahl |
36 |
276 |
139 |
137 |
16.40939 |
bourgeois |
37 |
269 |
133 |
136 |
16.10058 |
mehrwert |
38 |
268 |
107 |
161 |
16.04363 |
eignen |
39 |
267 |
143 |
124 |
15.84155 |
fall |
40 |
263 |
160 |
103 |
15.68388 |
worin |
41 |
251 |
144 |
107 |
15.51739 |
lage |
42 |
251 |
136 |
115 |
15.49208 |
klasse |
43 |
264 |
129 |
135 |
15.49115 |
england |
44 |
246 |
100 |
146 |
15.46483 |
produziert |
45 |
234 |
111 |
123 |
15.07548 |
produkts |
46 |
235 |
133 |
102 |
15.06427 |
arbeiterklasse |
47 |
239 |
119 |
120 |
15.01137 |
usw |
48 |
231 |
128 |
103 |
14.95939 |
konkurrenz |
49 |
230 |
150 |
80 |
14.94956 |
zahl |
50 |
235 |
132 |
103 |
14.94777 |
industrie |
51 |
224 |
60 |
164 |
14.81235 |
assoziation |
52 |
219 |
106 |
113 |
14.65953 |
maschine |
53 |
215 |
75 |
140 |
14.48388 |
erhält |
54 |
233 |
116 |
117 |
14.44541 |
of |
55 |
219 |
117 |
102 |
14.41876 |
preis |
56 |
204 |
67 |
137 |
14.13951 |
produzieren |
57 |
207 |
95 |
112 |
14.06949 |
andren |
58 |
205 |
131 |
74 |
14.06460 |
internationalen |
59 |
199 |
145 |
54 |
14.00675 |
produktiven |
60 |
199 |
95 |
104 |
13.90576 |
notwendige |
61 |
198 |
120 |
78 |
13.73963 |
internationale |
62 |
219 |
110 |
109 |
13.69838 |
herr |
63 |
200 |
96 |
104 |
13.67022 |
andre |
64 |
189 |
98 |
91 |
13.59859 |
maschinen |
65 |
191 |
135 |
56 |
13.45835 |
einzelnen |
66 |
183 |
52 |
131 |
13.38628 |
beschäftigt |
67 |
195 |
84 |
111 |
13.28736 |
lassen |
68 |
181 |
70 |
111 |
13.27777 |
täglich |
69 |
193 |
90 |
103 |
13.26917 |
paris |
70 |
178 |
137 |
41 |
13.10594 |
pariser |
71 |
175 |
99 |
76 |
13.01917 |
nachfrage |
72 |
184 |
87 |
97 |
12.99802 |
partei |
Комментариев нет:
Отправить комментарий