NeuralNetwork.cpp

//
//  NeuralNetwork.cpp
//  NeuralNetwork
//
//  Created by Pontus Ahlqvist on 6/28/16.
//  Copyright (c) 2016 PontusAhlqvist. All rights reserved.
//

#include "NeuralNetwork.h"

NeuralNetwork::NeuralNetwork(std::vector<std::string> neuronTypes, int numInputs, bool normalized){
    this->numInputs = numInputs;
    for(int i = 0; i < neuronTypes.size(); i++){
        std::vector<Neuron*> neurons;
        for(int j = 0; j < neuronTypes[i].length(); j++){
        
            Neuron* n;
            if(i == 0){
                n = generateNeuron(neuronTypes[i][j], numInputs);
            } else if (i < neuronTypes.size() || !normalized){
                n = generateNeuron(neuronTypes[i][j], (int)neuronTypes[i-1].length()); //connect to previous layer
            }
            neurons.push_back(n);
        }
        
        Layer* layer;
        if(!normalized || i < neuronTypes.size() - 1){
            layer = new Layer(neurons, false);
        } else{ //last layer is a normalized layer iff normalized is set to true
            layer = new Layer(neurons, true);
        }
        
        if(i>0){
            layer->setPrevLayer(layers[i-1]); //link up with previous layer if it's not the input layer
        }
        layers.push_back(layer);
    }
}

NeuralNetwork::~NeuralNetwork(){
    for(int i = 0; i < layers.size(); i++){
        delete layers[i];
    }
}

Neuron* NeuralNetwork::generateNeuron(char type, int numInputs){
    Neuron* n;
    if(type == 'e'){
        n = new ExponentialNeuron(numInputs);
    } else if(type == 's'){
        n = new SigmoidNeuron(numInputs);
    } else if(type == 'l'){
        n = new LinearNeuron(numInputs);
    } else if(type == 't'){
        n = new TanhNeuron(numInputs);
    } else{ //must have a default. Choose to be sigmoid
        std::cout << "WARNING: Unrecognized neuron type '" << type << "'. Using default neuron (sigmoid) instead." << std::endl;
        n = new SigmoidNeuron(numInputs); //input layer
    }
    return n;
}

std::vector<double> NeuralNetwork::forwardPropagate(std::vector<double> inputs){

    if(layers.size() == 1){
        output = layers[0]->computeLayer(inputs); //input layer
        return output;
    }

    layers[0]->computeLayer(inputs); //input layer
    for(int i = 1; i < layers.size() - 1; i++){
        layers[i]->computeLayer();
    }
    output = layers[layers.size()-1]->computeLayer(); //output layer
    return output;
}

void NeuralNetwork::backPropagate(std::vector<double> correctOutput){
    layers[layers.size()-1]->computeError(correctOutput);
    for(int i = (int)layers.size() - 2; i >= 0; i--){ //move backwards through layers
        layers[i]->computeError();
    }
}


void NeuralNetwork::printWeightsByLayer(){
    for(int i = 0; i < layers.size(); i++){
        std::cout << "*** Layer " << i << " ***" << std::endl;
        layers[i]->printWeightMatrix();
    }
}

void NeuralNetwork::printOutputs(){
    std::cout << "Output by Neural Network: ";
    for(int i = 0; i < output.size(); i++){
        std::cout << output[i] << " ";
    }
    std::cout << std::endl;
}

double NeuralNetwork::updateWeights(std::vector<double> inputs, double learningRate){
    double largestWeightUpdate = 0.0;
    largestWeightUpdate = std::max(largestWeightUpdate, layers[0]->updateWeightsInLayer(inputs, learningRate));
    for(int i = 1; i < layers.size(); i++){
        largestWeightUpdate = std::max(largestWeightUpdate, layers[i]->updateWeightsInLayer(learningRate));
    }
    return largestWeightUpdate;
}

double NeuralNetwork::trainOnDataPoint(std::vector<double> inputs, std::vector<double> outputs, double learningRate){
    //forward prop, backward prop, update weights
    this->forwardPropagate(inputs);
    this->backPropagate(outputs);
    return this->updateWeights(inputs, learningRate);
}

void NeuralNetwork::train(std::vector<std::vector<double> > inputMatrix, std::vector<std::vector<double> > outputMatrix, double learningRate){
    int numIters = 10000;
    double weightUpdateConvergenceThreshold = 0.001; //0.1% update - in case it finishes early
    double largestWeightUpdate = weightUpdateConvergenceThreshold + 1.0; //larger than convergence threshold.
    for(int iter = 0; iter < numIters && largestWeightUpdate > weightUpdateConvergenceThreshold; iter++){
        for(int trainingIndex = 0; trainingIndex < inputMatrix.size(); trainingIndex++){
            largestWeightUpdate = this->trainOnDataPoint(inputMatrix[trainingIndex], outputMatrix[trainingIndex], learningRate);
        }
    }
}

void NeuralNetwork::train(std::string fpath, double learningRate){
    std::vector< std::vector< std::vector<double> > > dataFromFile = this->readDataFromFile(fpath);
    std::vector< std::vector<double> > inputMatrix = dataFromFile[0];
    std::vector< std::vector<double> > outputMatrix = dataFromFile[1];

    //take this data and train on it
    this->train(inputMatrix, outputMatrix, learningRate);
}

void NeuralNetwork::predict(std::string fpath){
    std::vector< std::vector< std::vector<double> > > dataFromFile = this->readDataFromFile(fpath);
    std::vector< std::vector<double> > inputMatrix = dataFromFile[0];
    std::vector< std::vector<double> > outputMatrix = dataFromFile[1];
    std::cout << "Prediction on Data:" << std::endl;
    for(int i = 0; i < inputMatrix.size(); i++){
        this->forwardPropagate(inputMatrix[i]);
        this->printOutputs();
    }
}

std::vector< std::vector< std::vector<double> > > NeuralNetwork::readDataFromFile(std::string fpath){
    std::vector< std::vector<double> > inputMatrix;
    std::vector< std::vector<double> > outputMatrix;
    std::ifstream trainingFile(fpath);
    std::string line;
    while(getline(trainingFile, line)){
        //structure is x_1,...,x_n y_1,y_2,...,y_m (comma and space separated)
        int spacePosition = (int)line.find(" ");
        int lastCommaPosition = -1;
        int nextCommaPosition = (int)line.find(",",lastCommaPosition+1);

        //get inputs
        std::vector<double> input;
        while(nextCommaPosition != std::string::npos && nextCommaPosition < spacePosition){
            input.push_back(stod(line.substr(lastCommaPosition+1,nextCommaPosition)));
            lastCommaPosition = nextCommaPosition;
            nextCommaPosition = (int)line.find(",",nextCommaPosition+1);
        }
        input.push_back(stod(line.substr(lastCommaPosition+1,spacePosition)));

        //get outputs
        std::vector<double> output;
        lastCommaPosition = spacePosition;
        nextCommaPosition = (int)line.find(",",lastCommaPosition+1);
        while(nextCommaPosition != std::string::npos && nextCommaPosition < line.length()){
            output.push_back(stod(line.substr(lastCommaPosition+1,nextCommaPosition)));
            lastCommaPosition = nextCommaPosition;
            nextCommaPosition = (int)line.find(",",lastCommaPosition+1);
        }
        output.push_back(stod(line.substr(lastCommaPosition+1)));

        //add these training data points to the training matrices
        inputMatrix.push_back(input);
        outputMatrix.push_back(output);
    }
    trainingFile.close();
    std::vector< std::vector< std::vector<double> > > dataFromFile;
    dataFromFile.push_back(inputMatrix);
    dataFromFile.push_back(outputMatrix);
    return dataFromFile;
}