Hlavním problémem při přenosu učení z jedné datové sady do druhé je to, že datové sady nemusí být srovnatelné. Pokud se například snažíte naučit, jak předvídat chování zákazníka z jeho minulých nákupů, můžete použít datovou sadu údajů o minulých nákupech od zákazníků, kteří již byli dotazováni vaší společností. Pokud však chcete použít stejný algoritmus učení k předpovědi chování nových zákazníků, vaše datová sada může obsahovat pouze údaje o nákupech od zákazníků, kteří vaši společnost nedávno kontaktovali. To by znesnadnilo úspěšný přenos učícího algoritmu.
This is a guide to transfer learning in Python with a custom dataset. Transfer learning is a machine learning technique where you use a model trained on one task to perform another related task. For example, you might use a model trained on image classification to perform object detection. To do transfer learning in Python, you will need to have a dataset for the task you want to perform (e.g., images for image classification or text for text classification). You will also need a pre-trained model that you can use as a starting point for your own custom model. There are many different ways to do transfer learning, but we will focus on two of the most common: fine-tuning and feature extraction. Fine-tuning is where you take a pre-trained model and retrain it on your own dataset. This can be done by adding new layers to the existing model or by training the existing layers with new data. Feature extraction is where you take the features learned by a pre-trained model and use them in your own custom model. This is often done by adding a new classification layer on top of the extracted features. Both fine-tuning and feature extraction can be done using the Python library Keras. Keras makes it easy to work with pre-trained models and provides many helpful utilities for building custom models.
Začneme tím, že se podíváme na to, jak doladit předem trénovaný model na novém datovém souboru. Jako výchozí bod použijeme model VGG16, který byl natrénován na datové sadě ImageNet. ImageNet je velká datová sada obrázků, které byly klasifikovány do 1000 různých kategorií.
Nejprve musíme načíst model VGG16. Můžeme to udělat pomocí funkce Keras `load_model`.
Tento řádek kódu načte model VGG16 pomocí funkce Keras load_model.
Datasety
Datová sada je sbírka dat. V Pythonu jsou datové sady obvykle organizovány do souborů. Soubory v datové sadě mohou být čteny interpretem Pythonu nebo použity jako vstup pro funkce Pythonu.
Datasety
Datová sada je sbírka dat. V Pythonu jsou datové sady obvykle organizovány do souborů. Soubory v datové sadě lze číst interpretem Pythonu nebo použít jako vstup do programu Python.
Datová sada může být také uložena v databázi. V tomto případě je datová sada přístupná prostřednictvím rozhraní API databáze.
Datové rámce
Dataframe je výkonná datová struktura v Pythonu, která vám umožňuje ukládat a manipulovat s daty v tabulkovém formátu. Datové rámce jsou užitečné zejména pro práci s velkým množstvím dat, protože umožňují snadný přístup k jednotlivým částem dat a manipulaci s nimi, aniž byste se museli starat o jejich uspořádání do konvenčnější struktury.