Arduino Playground is read-only starting December 31st, 2018. For more info please look at this Forum Post

QuickStats Library - For Descriptive Statistics on Float Arrays

QuickStats is a library that provides simple descriptive statistics and linear regression (slope and intercept) for elements in float arrays, in Arduino.

Link to library: https://github.com/dndubins/QuickStats

I developed this library to help quickly accomplish median and mode filtering when collecting sensor data. Functions in this library operate on an array of float variables, of dimension "m", and return the corresponding statistic. This library was originally created for a data smoothing strategy for float variables. Using a median or mode filtering strategy (opposed to mean filtering) is better at removing spikes from aberrant readings. The other functions (stdev, CV, etc.) were included for fun.

A bubble sort algorithm is also contained in this library which was necessary to calculate median and mode.

The functions available in the library include:

    average(samples[],m); // the average of elements in samples[m]
    g_average(samples[],m); // the geometric mean of elements in samples[m]
    minimum(samples[],m); // the minimum value in samples[m]
    maximum(samples[],m); // the maximum value in samples[m]
    stdev(samples[],m); // the sample standard deviation of elements in samples[m]
    stderror(samples[],m); // the standard error of elements in samples[m] 
    CV(samples[],m); // the coefficient of variation in samples[m] in percent
    bubbleSort(samples[],m); // sorting algorithm to arrange the elements in samples[m]
    fabs(sample); // absolute value of a float, used in mode()
    median(samples[],m); // the median of elements in samples[m]
    mode(samples[],m,epsilon); // the mode of elements in samples[m] (returns 0 if no mode)
    slope(x[],samples[],m); // slope of linear regression dsamples/dx
    intercept(x[],samples[],m);// intercept of linear regression dsamples/dx
    filternan(float samples[],int &m); // filter nan and inf values out of a 1-dimensional array (destructive void function)
    f_round(float samples[],int m,int p); // overwrites samples[m] with values rounded to p decimals

/* // Example program for use with QuickStats.h
#include "QuickStats.h"
int numreadings = 9;
float readings[]={1.0,2.2,4.8,3.3,6.1,2.2,3.8,7.0,2.2};
QuickStats stats; //initialize an instance of this class
Serial.begin(9600);
Serial.println("Descriptive Statistics");
Serial.print("Average: ");
Serial.println(stats.average(readings,numreadings));
Serial.print("Geometric mean: ");
Serial.println(stats.g_average(readings,numreadings));
Serial.print("Minimum: ");
Serial.println(stats.minimum(readings,numreadings));
Serial.print("Maximum: ");
Serial.println(stats.maximum(readings,numreadings));
Serial.print("Standard Deviation: ");
Serial.println(stats.stdev(readings,numreadings));
Serial.print("Standard Error: ");
Serial.println(stats.stderror(readings,numreadings));
Serial.print("Coefficient of Variation (%): ");
Serial.println(stats.CV(readings,numreadings));
Serial.print("Median: ");
Serial.println(stats.median(readings,numreadings));
Serial.print("Mode: ");
Serial.println(stats.mode(readings,numreadings,0.00001));
}
//END OF FILE

[Get Code]

Notes

To use the library, make a folder in your SKETCHBOOKPATH\libraries with the name QuickStats and put the .h and .cpp there.

To do

Looking at creating a version for integers.

QuickStats.h file

QuickStats.h:

/* QuickStats.h - Library for quick descriptive statistics of an array samples[] of size m,
* assuming a normal distribution.
* Created by David Dubins, January 10th, 2016.
* Released into the public domain.
*/
#ifndef QuickStats_h
#define QuickStats_h
#include <Arduino.h>
class QuickStats {
public:
QuickStats();
~QuickStats();
float average(float samples[],int m);
float g_average(float samples[],int m);
float minimum(float samples[],int m);
float maximum(float samples[],int m);
float stdev(float samples[],int m);
float stderror(float samples[],int m);
float CV(float samples[],int m);
void bubbleSort(float A[],int len);
float median(float samples[],int m);
float mode(float samples[],int m,float epsilon);
float slope(float x[],float samples[],int m);
float intercept(float x[],float samples[],int m);
void filternan(float samples[],int &m);
};
#endif
//END OF FILE

[Get Code]

QuickStats.cpp

/* QuickStats.cpp - Library for quick descriptive statistics of an array samples[] of size m
* Created by David Dubins, January 10th, 2016.
* Released into the public domain.
* Requires Arduino 1.6.6 or greater.
* https://pb860.pbworks.com
*/
#include "Arduino.h"
#include "QuickStats.h"
#include <math.h>
QuickStats::QuickStats(){/*nothing to construct*/}
QuickStats::~QuickStats(){/*nothing to destruct*/}
float QuickStats::average(float samples[],int m)
{
float total1=0.0;
for(int i=0;i<m;i++){
total1=total1+samples[i];
}
return total1/(float)m;
}
float QuickStats::g_average(float samples[],int m)
{
float total1=0.0;
for(int i=0;i<m;i++){
total1=total1+log(samples[i]);
}
return exp(total1/(float)m);
}
float QuickStats::minimum(float samples[],int m)
{
float sorted[m]; //Define and initialize sorted array
for(int i=0;i<m;i++){
sorted[i]=samples[i];
}
bubbleSort(sorted,m); // Sort the values
return(sorted[0]); // first element is the minimum
}
float QuickStats::maximum(float samples[],int m)
{
float sorted[m]; //Define and initialize sorted array
for(int i=0;i<m;i++){
sorted[i]=samples[i];
}
bubbleSort(sorted,m); // Sort the values
return(sorted[m-1]); // last element is the maximum
}
float QuickStats::stdev(float samples[],int m)
{
float avg=0.0;
float total2=0.0;
avg=average(samples,m);
for(int i=0;i<m;i++){
total2 = total2 + pow(samples[i] - avg,2);
}
return sqrt(total2/((float)m-1.0));
}
float QuickStats::stderror(float samples[],int m)
{
float temp1=0.0;
temp1=stdev(samples,m);
return (temp1/sqrt((float)m));
}
float QuickStats::CV(float samples[],int m) //Coefficient of variation (%RSD, or relative stdev)
{
float avg=0.0;
float sd=0.0;
avg=average(samples,m);
sd=stdev(samples,m);
return 100.0*sd/avg;
}
void QuickStats::bubbleSort(float A[],int len)
{
unsigned long newn;
unsigned long n=len;
float temp=0.0;
do {
newn=1;
for(int p=1;p<len;p++){
if(A[p-1]>A[p]){
temp=A[p]; //swap places in array
A[p]=A[p-1];
A[p-1]=temp;
newn=p;
} //end if
} //end for
n=newn;
} while(n>1);
}
float QuickStats::fabs(float sample) // calculate absolute value
{
if(sample<0.f){
return -sample;
}else{
return sample;
}
}
float QuickStats::median(float samples[],int m) //calculate the median
{
//First bubble sort the values: https://en.wikipedia.org/wiki/Bubble_sort
float sorted[m]; //Define and initialize sorted array.
float temp=0.0; //Temporary float for swapping elements
/*Serial.println("Before:");
for(int j=0;j<m;j++){
Serial.println(samples[j]);
}*/
for(int i=0;i<m;i++){
sorted[i]=samples[i];
}
bubbleSort(sorted,m); // Sort the values
/*Serial.println("After:");
for(int i=0;i<m;i++){
Serial.println(sorted[i]);
}*/
if (bitRead(m,0)==1) { //If the last bit of a number is 1, it's odd. This is equivalent to "TRUE". Also use if m%2!=0.
return sorted[m/2]; //If the number of data points is odd, return middle number.
} else {
return (sorted[(m/2)-1]+sorted[m/2])/2; //If the number of data points is even, return avg of the middle two numbers.
}
}
float QuickStats::mode(float samples[],int m,float epsilon) //calculate the mode.
//epsilon is the tolerance for two measurements to be equivalent.
{
//First bubble sort the values: https://en.wikipedia.org/wiki/Bubble_sort
float sorted[m]; //Temporary array to sort values.
float temp=0; //Temporary float for swapping elements
float unique[m]; //Temporary array to store unique values
int uniquect[m]; //Temporary array to store unique counts
/*Serial.println("Before:");
for(int i=0;i<m;i++){
Serial.println(samples[i]);
}*/
for(int i=0;i<m;i++){
sorted[i]=samples[i];
}
bubbleSort(sorted,m); // Sort the values
/*Serial.println("Sorted:");
for(int i=0;i<m;i++){
Serial.println(sorted[i]);
}*/
// Now count the number of times each unique number appears in the sorted array.
unique[0]=sorted[0];
uniquect[0]=1;
int p=0; // counter for # unique numbers
int maxp=0;
int maxidx=0;
for(int i=1;i<m;i++){
if(fabs(sorted[i]-sorted[p])<epsilon){
uniquect[p]++; //if same number again, add to count
if(uniquect[p]>maxp){
maxp=uniquect[p];
maxidx=p;
}
} else {
p++;
unique[p]=sorted[i];
uniquect[p]=1;
}
}
/*for(int i=0;i<p+1;i++){
Serial.println("Num: " + (String)unique[i] +" Count: " + (String)uniquect[i]);
}*/
if (maxp>1) {
return unique[maxidx]; //If there is more than one mode, return the lowest one.
} else {
return 0.0; //If there is no mode, return a zero.
}
}
float QuickStats::slope(float x[],float samples[],int m) //calculate the slope (dsamples/dx)
{
float xavg=average(x,m);
float yavg=average(samples,m);
float numerator = 0.0;
float denominator = 0.0;
for(int i=0;i<m;i++){
if(x[i]-xavg!=0.0){ // protect against dividing by zero
numerator = numerator + (x[i]-xavg)*(samples[i]-yavg);
denominator = denominator + ((x[i]-xavg)*(x[i]-xavg));
}
}
return numerator/denominator;
}
float QuickStats::intercept(float x[],float samples[],int m) //calculate the intercept (dsamples/dx)
{
float xavg=average(x,m);
float yavg=average(samples,m);
float beta=slope(x,samples,m);
return yavg-(beta*xavg);
}
void QuickStats::filternan(float samples[],int &m) //removes nan values and returns size of filtered matrix (destructive)
{
int duds=0; //keep track of #nans
int nums=0; //keep track of numbers
float filtered[m];
for(int i=0;i<m;i++){
if(isnan(samples[i])||isinf(samples[i])){
duds++; // found a nan
}else{
filtered[nums]=samples[i];
nums++; // found a number
}
}
for(int i=0;i<nums;i++){
samples[i]=filtered[i]; //overwrite sample matrix with filtered matrix
}
m=nums; //overwrite matrix size
}
void QuickStats::f_round(float samples[], int m, int p) //round float variable to a given # decimals, p
{
float precision=pow(10.0,p);
for(int i=0;i<m;i++){
samples[i]=round(samples[i]*precision)/precision;
}
}
//END OF FILE

[Get Code]