В июне 1820 года Гумбольдт представил Берлинской академии план создания новой дисциплины сравнительного языкознания и изложить ее методологию в статье «О сравнительном изучении языка и его связи с различными периодами языкового развития» (Über das vergleichende Sprachstudium in Beziehung auf die verschiedenen Epochen der Sprachentwicklung). Он рассматривал функцию языка не как простую передачу существующих идей и концепций, а как «формирующий орган мышления», который является инструментом для создания новых концепций, которые без него не возникли бы. Различия между языками для него не были различиями в «звуках и знаках», но в конечном счете «различиями в представлении мира». Гумбольдту казалось неправильным отделение друг от друга философии языка и эмпирической лингвистики, поскольку лингвистика нуждается в концептуальной философской базе. По мнению Гумбольдта, эмпирическое исследование фактического использования языка на примерах разных языках с совершенно различными структурами дало бы философу конкретное понимание природы человеческого языка, которое иначе постигнуть невозможно.
С помощью своего брата Александра Вильгельму удалось собрать, вероятно, самую большую коллекцию лингвистических материалов в Европе своего времени. На земном шаре практически не было языковой группы, которая не привлекла бы его внимания. Гумбольдт знал и изучал древнегреческий, латынь, санскрит, все романские языки, английский, баскский, древнеисландский, литовский, польский, словенский, сербохорватский, армянский, а также венгерский. В той или иной степени он также знал иврит, арабский и коптский, для которого он даже написал грамматику. Из азиатских языков Гумбольдт изучал китайский, японский, сиамский и тамильский. В центре его работы, помимо баскского языка (он считается основателем басковедения), находились родные языки Южной, Центральной и Северной Америки, а с 1827 года также – языки Тихоокеанского региона от Восточного побережья Африки до Гавайев и островов Южного моря, образующие то, что сегодня называют австронезийской языковой семьей, чье существование Гумбольдт впервые убедительно доказал. Всего в его архиве сохранились исследования, заметки, наблюдения и материалы, относящиеся более чем к 200 языкам. В личном и публичном общении Гумбольдт, кроме немецкого, широко использовал французский, английский, итальянский и испанский.
В статье «О задаче историка» Гумбольдт отличает историческое понимание от простых дедуктивных рациональных процедур, называя его ассимиляцией исследовательской способности и исследуемого объекта. Он также вводит понятие «предсуществующей основы понимания».
В последние годы жизни Гумбольдт работал над исследованием языка кави на острове Ява в контексте австронезийской языковой семьи, но успел завершить только введение и 1‐ю главу, которые были опубликованы в 1836 году в 1‐м томе под названием «Работа по кави» (Kawi Werk). Незавершенные 2‐й и 3‐й тома были опубликованы в 1838 и 1839 годах. Американский лингвист Леонард Блумфилд (1887–1949) так отозвался об этом труде: «Второй том великого трактата Гумбольдта положил начало сравнительной грамматике малайско-полинезийской языковой семьи». Гумбольдт полагал, что характер и структура языка выражают внутреннюю жизнь и знания его носителей, и поэтому языки должны отличаться друг от друга точно так же, как и те, кто их использует. Звуки не становятся словами до тех пор, пока в них не будет вложен смысл, и этот смысл воплощает мысль сообщества. Под внутренней формой языка он понимал способ обозначения отношений между частями предложения, который отражает то, как определенная группа людей относится к окружающему миру. Задача морфологии речи, по Гумбольдту, состоит в том, чтобы различать способы, которыми языки отличаются друг от друга в том, что касается их внутренней формы, и классифицировать и упорядочивать их соответствующим образом.