Вивчення векторних моделей текстів XX століття допомогло простежити за зміною настроїв і стереотипів в США. Це доводить, що зміни в мові безпосередньо пов’язані зі змінами в суспільстві.
Суть векторних моделей в тому, що якщо два вектори, які відповідають різним словами, знаходяться близько один до одного, то можна говорити про те, що ці слова близькі і за значеннями. Наприклад, вектор, що представляє слово «мама», буде ближчим до вектора «тато», ніж до вектора «синхрофазотрон».
Така система аналізу працює завдяки машинному навчанню з використанням величезних корпусів текстів – добре для цього підходить Вікіпедія, оскільки ефективність і точність векторної моделі цілком залежить від вибірки: якщо навчити її, наприклад, на серії оповідань Клайва Льюїса, то слова «дівчинка» і «лев» будуть ближче один до одного, ніж «дівчинка» і «лялька». Модель при цьому буде працювати коректно з математичної точки зору, але не відповідати дійсності.
Вчені зі Стенфордського університету за участю Дена Журафскі побудували векторні уявлення слів, найбільш відповідні жінкам і азіатам. Для цього вони використовували тексти з Google Books і Corpus of Contemporary American English, що датуються проміжком від 1900-го року до кінця XX століття та розбиті на десятиліття. Ці вектори порівняли з доступними демографічними даними за кожен період.
В 1910-х роках серед найближчих до жінки словами були «мрійлива» і «мила», в 1950-х – «без смаку» та «згодна», а в 1990-х – «штучна» та «неприродна». Змінилися векторні уявлення й для азіатів: в 1910-х їх описували як «заздрісних», в 1950-х – «неорганізованих», а в 1990-х – «стриманих». Прикметники, пов’язані з жінками, стали сильно відрізнятися, починаючи з кінця 60-х років: в той час в США процвітав феміністський рух. Слова, що описують азіатів, почали розрізнятися на початку 60-х – під час другої хвилі імміграції з країн Азії, а також на початку вісімдесятих, коли приріст нових іммігрантів зменшився, а у минулого покоління з’явилися нащадки.
Дослідники також виявили зв’язок між векторними моделями та реально поширеними професіями серед жінок за кожен період. Але навіть в тих професіях, де число жінок і чоловіків було приблизно рівним, перевага була на стороні чоловіків – тому вчені простежили й за ухилом в бік гендерної рівності протягом часу. Починаючи з 50-х років, розрив наблизився до нуля – з часом гендерний ухил в професіях знижувався. Те ж саме відбувалося і для групи етнічних меншин: в даному випадку – азіатів.
Автори статті підсумовують, що всі зміни, навіть які відбувалися протягом порівняно малого часу, добре відображає лексика. Тобто трансформації в суспільстві дуже швидко відгукуються і в нашій мові.