Сказать честно, то исконная лексика это самая трудная часть лесической системы как таджикского, так и персидского языков. Типов заимствований, в принципе там не очень много и все они подлежат формализации и анализу... Там ничего трудного нет. Метод непосредственно составляющих, формализационный подход, сопоставительный метод и пара щепоток соли, вот и весь рецепт:)  А вот исконная лексика - это нечто... С ноном и бобом - разобраться таки можно... Там просто надо немного углубиться в анализ морфем, фонемных составляющих и т.д (пара аспиринчиков отголовной боли). НО вот правильно отсечь постфикс и префикс... Вот допустим есть слово боЧпулИ (Ч - ج, И - ی). ориентируясь в постфиксах и префиксах и не смотря на семантику мы можем предположить: 1 - слово состоит из префикс бо+корень Чпул+ постфикс И; 2 - корень боЧ +сложный постфикс пулИ (пул+И); 3 - корень боЧ+корень пул+ постфикс И. В данном случае для лингвистического алгоритма первого уровня будут приемлимы 2 и 3 варианты. Почему же отброшен1-й? А потому что рассматривая его алгоритм находит его в положении "ложно". Да, есть префикс бо, но анализируя фонетические модели коренных слов ТЯ и ПЯ, алгоритм понимает что корень не может начинаться с двух согласных(Чпул), особенно в положении обе глухие (конечно с глухостью Ч можно поспорить, но все же, это в принципе тоже что и "ч"...) Ну уже алгоритм второго уровня отсеет и 2-й вариант,т.к. постфикса пул - нет, а есть такое коренное слово. Вот типа в кратце как то так... Единственное исконное персидское слово начинающееся с двух подряд идущих согласных - это Спитамен...